本帖最后由 ncwls 于 2016-3-27 17:42 编辑
异夫的世界(转发)
大学是养怪人的地方。异夫(George Kingsley Zipf, Zipf的发音是/zif/)就是一个怪人。他1902年出生于美国的一个德国移民家庭,到他是第三代移民。1924年,异夫在哈佛大学毕业,然后到德国留学。1929年,他拿到了哈佛大学比较文学博士学位,开始在哈佛教授德语。后来,他被聘为哈佛大学德语系系主任,同时担任“校聘讲师”(University Lecturer),这意味着他想讲什么课就可以讲什么课。他除了讲授德语,还钻研汉语、人口学,但真正让异夫教授青史留名的是,他发现了一个奇特的规律:异夫规律(Zipf’s law)。
20世纪40年代,威斯康辛大学的学者花了14个月的时间,把乔伊斯的名著《尤利西斯》从头到尾打印在硬纸板上,然后把每一个词都裁下来,相同的词黏在同一张大纸上。经过这一番折腾,他们找出了乔伊斯使用的每个词汇出现的频率。这个发现引起了异夫的注意。他一眼看出,这里面暗藏玄机。
在《尤利西斯》中,I出现的频率排名第10,在全书中共出现了2653次。“say”出现的频率排名第100,在全书中共出现了265次。“bag”出现的频率排名第1000,在全书中共出现了26次。排名第10,000的是个生僻的词:“orangefiery”,这个词仅出现了两次。
异夫发现,某个词汇出现的序号和该词出现的次数的乘积几乎是一个常数。第10名出现的次数是第100名的10倍,第1000名的100倍,第10,000名的1000倍。以此类推,第2名出现的次数大约是第1名出现次数的1/2,第3名出现的次数大约是第1名出现次数的1/3,…后来,人们发现,在英语中使用次数最多的词是“the”,第2名是“of”,第3名是“and”。“the”出现的频率为7%,“of”出现的频率恰好为3.5%。“异夫规律”不仅仅适用于英文,其它语言,包括中文在内,都符合这一规律。
异夫教授还在其它的地方发现了这一规律。城市人口同样符合“异夫规律”。根据1940年美国人口调查,人口最多的城市是纽约,当时有1200万人,排名第10的是俄亥俄州的克利夫兰(Cleveland),人口为120万,排名100的是俄亥俄州的汉密尔顿(Hamilton),人口为11万。同样,一个城市的大小排序和其人口数量的乘积几乎是个常数。“异夫规律”如今已经成了地理经济学的秘密武器,它雄辩地指出,城市的扩大能够带来“规模经济”。美国桑塔菲研究所(Santa Fe Institute)的物理学家Geoffrey West发现,如果城市的规模扩大一倍,创新的数量、人均工资水平都将提高15%,当然,艾滋病发病率、犯罪率同样也会提高。不同的国家,比如美国和日本的城市化走过的道路相差极大,但殊途同归,最后的结果都是这样。克鲁格曼在《地理与贸易》一书中就曾感叹,在社会科学中能够被称为“规律”的寥寥无几,勉强能称得上“规律”的,和现实世界拟合得也很不好,唯独这个“异夫规律”,居然和现实世界几乎拟合得天衣无缝。
为什么会出现这一规律呢?按照异夫的解释,这是因为“最小努力法则”(principle of least effort)。人生来是懒惰的,能省事就省事。我们频繁地使用有限几个词汇,是因为这样不用太动脑筋。我们都愿意住在大城市,是因为大城市里生活舒适。异夫的这一观点只是他自己的臆想。他并没有给出严密的数学证明。从直觉来说,他的说法站不住脚。乔伊斯可不是一个懒惰的作家,他有意地炫耀自己的才华。具有冒险精神的年轻人才会到大城市,懒人很可能会选择生活在小城市里。
“异夫规律”的背后,揭示的是一种人类社会的内在秩序。早在异夫之前,意大利经济学家帕累托就曾经指出,一个社会中,个人的财富排序和其拥有的财富数量之乘积几乎是一个常数。第2名富翁的财富大约为第1名的1/2,第3名富翁的财富大约为第1名的1/3,以此类推。这意味着,富有的人极其富有且为数极少,贫穷的人一无所有且人数众多。1906年,帕累托写到,在意大利,20%的人口拥有80%的土地。这启发了一位做管理咨询的专家Richard Koch。他在1997年出版了一本畅销书《80/20定律》,将帕累托的思想几乎推广到极致:80%的工作是由20%的人完成的(你我都在这20%之内);80%的利润来自20%的客户;80%的抱怨也来自20%的客户;80%的电视观众只看20%的电视节目;80%的艳遇来自20%的“把妹达人”,等等。
有意思的是,“异夫规律”和“80/20定律”不仅仅出现在人类社会中,在自然界里也时常可见踪影。帕累托自己发现,他花园里80%的豆子来自20%的豆荚。“异夫规律”和“80/20定律”说的是同样一件事情:即一个变量和另一个变量的幂成反比,这被称为“幂定律”(power laws)。幂定律无处不在:小的地震每时每刻都在发生,但我们几乎感觉不到,大的地震发生的次数很少,但带来的破坏力巨大。小的森林火灾时有发生,但大多数时候会自生自灭,大的森林火灾发生的次数很少,但一旦失控,有可能将整个森林烧掉。
这一切无法仅仅用“最小努力法则”来解释。这一切很可能无法用经济学家所熟悉的“动机决定行为”的理性选择套路来解释。统计学的“正态分布”在这里彻底失灵。“正态分布”预言的是一个趋向中庸的社会:天才很少、傻瓜也很少,出现最多的是你我这样的凡人。“异夫规律”则预言的是一个趋向极端的世界,少数压倒多数,少数统治多数。
如何解释“异夫规律”和“幂定律”?有的学者看到了其中的“随机游走”,有的学者强调在演进过程中的积累,有的学者认为这代表了自然的常态,有的学者预言这意味着最后会出现革命。我们至今还无法找到一个统一的理论,解释这种现象的内在动因。但是,就思想的探索而言,“异夫规律”告诉我们,在我们熟悉的经济学世界之外,还存在着很多平行宇宙。
|