本福特法则:为什么以“1”开头的数字最多?

本福特法则为什么以1开头的数字最多

今天我给你们讲一个关于数字的管理学故事

在进入正题之前我想先给大家做两个小测试

第一个小测试如果你看到一本书的前几页比后面的页数翻得更烂你会想到什么

第二个小测试对全世界所有城市的海拔高度数据我们把它都收集来了然后我们把它的第一个数字提出来比如说海拔 4567 米提出的第一位数字就是4那么在这些所有数字里面1 到 9 哪个数字出现的次数最多所有数字的分布又会是怎么样的

对于第一道题大部分的人都会想这是一本无聊的书人看了开头就看不下去了所以把开头的页数翻得很烂后面还是很新如果你只是想了这么多那么你可能就错过了一个流芳百世的机会

对于第二道题大部分的人认为第一位数字的分布应该是平均的因为一共有九位数字第一位数字不能是 0那么只能是 1 到 9每一个数字出现的频率应该是 1/9就是 11% 左右如果你也是这么认为的那么你就大错特错了 

通过真正的数据统计分析这些海拔高度的第一位数字的分布其实绝对不是一个平均分布它们的分布实际上是这样的数字 1 出现的概率大概是 30% 左右远远高于数字 2 的 18%数字 3 的 13%等到 9 出现的时候的概率大概只有不到 5% 了

这就是著名的本福特法则从实际生活中得出的数据中以 1 为首的数字的出现的概率约为总数的三成接近期望值 1/9 的三倍

本福特法则其实不是一个新的法则在大概一百多年前数学家们就发现了这个现象

1881 年的时候有一个加拿大天文学家他叫西门纽康柏他发现对数表以 1 起首的那一页比其他页数翻得更加烂我不知道现在有多少朋友还知道什么是对数表因为现在计算机计算器已经非常普及了但是我们那一拨人上学的时候都是要用对数表去查对数比如 log2log3 是多少我们要去查表西蒙和大多数人一样当时也没有往深处想所以他错过了一个在科学史上留名的机会