斩乱麻问题--斩乱麻问题、幂律成因与组成理论之一--2005-9-4--张学文

bullet

今年春发现奇迹网站的理念和内容都比较适合我的认识。就向这里投了些我的文章算参加活动。10天前我把关于“个”这个概念的讨论稿贴到这里,10天内居然有300次的阅读量。我感到这里学物理的比较多,年轻人多,是个值得关注和活动的地方。于是决定动笔写这个半介绍性的文章与大家交流。希望青年朋友喜欢(最好是继续做些工作)。
斩乱麻问题是我们10年前提出的问题、“幂律”就是50年前Zipf发现的负幂分布函数,也是分型创始人Mandebort大力宣扬的函数,它适用于大量的社会现象和自然现象中。组成理论是我提出的一个知识系统,(见中国科技大学2003年出版的“组成论”一书)。本文就把这3个知识点串联起来。

bullet

斩乱麻问题是这样一个简单问题:有一段长度为L的麻绳(如L=100米)。用一把快刀随机地砍上N刀(如N=9999刀),结果自然形成一堆(N+1段)麻线头(10000段)。问不同长度的线头各占多大的比例(的事件最容易出现)。

bullet

您打算如何解决这个问题的?
我们认为本问题不是求一个得“数”,而是求一个函数:长度(l)与具有该长度的线头的数量(n)的关系[n=f(l)]。这个函数体现了N+1段线头是如何分布在不同长度范围(区间)内的。我们称为分布函数。
砍出来的线段都恰好具有相同的长度的事件固然可能出现,但是它出现的可能性太低了。随机的砍,必然容易出现有的长有的短的复杂局面。应当认为最复杂、最任意(熵最大)的局面(结局)是最容易出现的。
如果不同的分布函数对应(代表着)不同的复杂程度、任意程度、混乱程度(熵的数值),那么利用复杂程度最大(熵最大,类似求极值)就可以反求这个函数,那么我们的问题就有了解决的途径。

bullet

确实,我们在《组成论》(网页版:http://xjqxsc.idm.cn/zhangxw%20web/ZCL/index.htm ) 里就是用这个思路解决这个问题的。那里对这个问题的数学推导仅占1页纸面,它并不复杂。在解这个问题时我们利用了一个约束条件:各个线段的长度的合计值应当等于原长度L,这自然是合理的。它对应“线段的长度的平均值为固定值”。

bullet

利用上面方法得到的函数是个负指数函数,即多数的线段很短,特别长的比例非常少。这个函数联系着物理学中的玻耳兹曼分布,我们是用另外的思路分析了玻耳兹曼的分子能量分布。负指数分布是统计学中的著名分布,它有很多实用例子。斩乱麻问题是利用熵最大求负指数分布的生动例子。

bullet

下一短文沿这里的思路讨论幂律分布的形成原因。