chispa1707: (Default)
[personal profile] chispa1707
Подобрал в Экселе две недостающие формулы, и все, в общем, получилось. Обработаны 154 тысячи датированных регионо-событий В одно целое сведены пары типов событий, встречающиеся в одно время и в одном месте в более чем 20 % случаев (то есть, очевидно связанные) и средняя дата таких встреч. По сути, создана математическая модель всей человеческой истории - корректная модель, без человеческого фактора в моем лице. Даты взял традиционные, то есть, я в данном случае даже не ревизионист.
***
К этому я подбирался года три, - не было должного понимания. Теперь - всё. Можно расписывать.
Всё помещается в 4 колонки и 6 тысяч строк. Пары с очевидными, но случайными связями (типа нафталин-война) буду убирать. Впрочем, некоторые связи только кажутся случайными: так, обнаружил я пару "золото-фенол", глянул справочную статью, и оказалось, что именно фенолами восстанавливают драгметаллы из солей, в том числе и солей золота - так и написано. Это имело колоссальное финансовое значение в середине 19 века.
***
Фантастический по значению прорыв. Теперь, если даже что-то слетит или обнаружится ошибка, весь массив со всеми связями, датами и процентами можно заново создать часов за 10-12. В техническом смысле двигаться больше некуда: все, что требуется, теперь есть - в самом оптимальном виде.
***
Помехи будут, поскольку сдвиги внутри массива совершенно точно есть, однако эти помехи вторичны.
***
Особая благодарность создателям программы Excel: чтобы получить рабочее поле в 613 тысяч ячеек, я заставил Excel-2007 оценить порядка 44 млн. ячеек, и программа не повисла ни разу. До сих пор переживаю некоторый шок, - слишком долго был уверен, что это технически неисполнимо.
***
Итоговые 6 тысяч пар составляют от 613 тысяч менее 1 % вариантов, и надо понимать, что это лучший в смысле корреляции 1 %. Мусора, по сути, нет.
***
Поскольку большие массивы тяжелы, правильно будет взять небольшой кусок базы данных, скажем, на 20 тысяч строк, и в одном файле поэтапно этот кусок переработать в модель, попутно внятно объясняя, что и как делается. Так, чтобы эксперимент был абсолютно понятен и повторим любым человеком. В конце файла показать полную модель и то, какие выводы из нее следуют. Добавляя или удаляя индексы и увеличивая или уменьшая рассматриваемый период, или выбирая нужный регион, каждый желающий сможет создать свой вариант модели, и сделать свои выводы.
This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

Profile

chispa1707: (Default)
chispa1707

May 2022

S M T W T F S
1234567
891011121314
1516171819 20 21
22232425262728
293031    

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 21st, 2025 09:37 am
Powered by Dreamwidth Studios