LE Blog

Инженер с поэтической душой

26.08.2020 firtree_right Закон Ньюкома-Бенфорда

Мне кажется, что когда-то я уже об этом писал, но без примеров. Наверное, при консолидации блогов потерялось где-то. Поэтому напишу ещё раз. Посмотрели с Ирой «Connected» на «Нетфликсе», и я вспомнил, как когда-то был сильно впечатлён законом Ньюкома-Бенфорда. Суть в том, что существует категория случайных величин, которые будучи записаны в любой шкале подчиняются одному и тому же правилу. Первая значащая цифра 1 в них встречается 30.1% случаев, 2 — 17.6%, 3 — 12.5% и так далее. И удивительное в этом то, что этот закон рапространяется не только на длины рек, высоты гор, площади озёр и расстояния между галактиками, но и на сгенерированные людьми наборы чисел: суммы денег на счетах, число связей в социальных сетях или высоты небоскрёбов в метрах и футах.

Для проверки я решил сгенерировать свои наборы данных. Для примера взял один из рабочих проектов. Сначала посчитал все интервалы в секундах между изменениями в течение всей жизни проекта (1). Потом — сколько раз встречается каждый символ во всех файлах проекта (2). Для сравнения так же посчитал сколько раз встречается каждый символ в моих статьях (3). И вот какая частота первых значащих цифр у меня получилась в сравнении с предсказанным законом Бенфорда (оранжевый):

benford's law