一、奔福德定律的内涵
(一)奔福德定律经典理论 奔福德定律是由美国数学家、天文学家赛蒙·纽卡姆(Simon Newcomb)在1881年首次发现的。经过对大量随机数据的统计分析,他发现这些数据都很好地符合这样的规律:以1为第一位数的随机数要比以2为第一位数的随机数出现的概率要大,而以2为第一位数的随机数要比以3为第一位数的随机数出现的概率要大,依此类推。
大约50年之后,美国通用电器的物理学家弗瑞克·奔福德(Frank Benford)又独立发现了这一现象并得出了和Newcomb一样的结论。他收集了很多数据进行分析来验证自己的假说,这些数据包含了尽可能多的种类和范围,数据的收集和整理花费了他7年的时间。他验证了总数为20229个的20组数字,其中包括篮球比赛的数字、河流的长度、湖泊的面积、各城市人口分布数字、在某一杂志里出现的所有数字等。弗瑞克·奔福德推导了奔福德定律的数学表达式,即数字的第一位上各个非0数字出现的概率,用公式1表达如下:
(1)
其中:D=1,2,3……9;P=probability 代表概率。
根据公式(1),数字第一位上出现“1”的概率大约为30%,而出现“9”的概率仅为4.6%。把1,2,3……9分别代入式(1),所得结果如表1所示:
表1 数字第一位上1~9出现概率
1 |
0.301030 |
6 |
0.066947 |
2 |
0.176091 |
7 |
0.057992 |
3 |
0.124939 |
8 |
0.051153 |
4 |
0.096910 |
9 |
0.045758 |
5 |
0.079181 |
|
|
将这一分布规律用图表示则更加清晰,如图1所示。
图1 奔福德定律概率分布
1996年美国学者Hill从理论上对奔福德定律给出了满意的解释,并进行了严谨的数学证明(因其证明过程比较复杂,也不是本文探讨的重点,故不赘述)。
(二)奔福德定律的扩展 后人又对奔福德定律做了大量的扩展研究,这些扩展主要包括:
(1)其他位置上数字的分布规律。Hill指出,数字第二位上出现1~9的概率从“0”依次到“9”也是降序排列的,但其依次下降的幅度远远小于第一位数字。进而又有人继续深入研究,从第二位拓展到第三位、第四位。Nigrini通过研究给出了从0~9每个数在数字的第一位至第四位上出现的概率的数表,通过该数表可以查出数字0~9在随机数第一位至第四位上出现的概率。
(2)数字分布的条件概率。有人研究了将第一位和第二位上出现的数字联系起来考虑的情况,即条件概率,因为人们发现,各个位置上数字出现的概率不是相互独立的。
(3)度量单位变化的情况。数学家Pinkham的研究证明了奔福德定律不受度量单位的影响。他指出如果某一系列数字很好地吻合了奔福德定律,并且这些数字符合持续增长的规律,那么无论它们使用什么度量单位,都依然遵循奔福德定律。这一发现很好地解释了为什么不同国家、不同货币的财务数据都遵循奔福德定律。另外一个有趣的现象是,一组符合奔福德定律分布的数字,它们的倒数依然符合奔福德定律分布。
(4)数字进制变化的情况。人们还发现奔福德定律在数字的进制改变的情况下依然有效。比如从人们最常用的10进制改为12进制、6进制、5进制……2进制,数字的首位数上依然是“1”出现的频率最高,当然,进制不同时,所对应的各个数字在首位数出现的概率也有所变化。
Total:212
责任编辑:admin
参与评论
验证码:
用户名