我对熵的认识进程之三

horizontal rule

张学文2008-4-22 

改造熵的知识体系

 1 把分布函数概念、熵概念和熵最大原理用到气象学的成绩,使我感到这是好思路、好做法。于是我就设法把这个思路扩大到非热力学、非信息论的其他自然科学和社会科学中去。为此,组织过熵与交叉科学研讨会(1987-2001),并且在我写的《组成论》(2003)中有初步但是系统的总结。你可以把它说成是“改造后的熵”。这里主要涉及熵的定义、含义以及为什么熵原理是对的,等等。

2   改造后的“熵概念”不从热力学的卡诺循环开始,也不从信息论的“不确定性”开始,而是走了个知识链更长,但是更基础,适应面更宽的路子。张江在评论中说:与其他探讨熵的文章不同,作者把熵建立在一个很简单、清晰的广义集合的背景上讨论。这为我们理解熵具有非常鲜明的指导意义。我把熵称为事物的状态的复杂(丰富、多样)程度。

3  具体的思路是在个体概念和每个个体具有特定的标志值的基础上,先定义一个广义集合概念。如55个小学生(个体)组成的班,而考虑学生的身高为标志值,我们就把由这些学生和他们的具体身高组成的知识集体称为广义集合。我们说明各个领域的广义集合实在是太多了(不同价格的图书、不同收入的家庭、不同人口的国家、不同能量的分子…)。

4  对于每个明确的广义集合,都可以问:具有不同标志值的个体各有多少(如不同身高的学生各有多少)。这个问题的答案就是该广义集合的分布函数。每个明确的广义集合必然具有一个确定的分布函数(在确定的时刻)。

5 下面给出一班55个“学生-身高”组成的一个广义集合的例子

身高<1米的学生数量12= N1

身高1-1.1米的学生数量15= N2

身高1.1-1.2米的学生数量18=N3

身高>1.2米的学生数量10= N4

它回答了不同身高的学生各有多少问题:

学生总数=12+15+18+10=55=N

N1+N2+N3+N4=N=55

在有了分布函数(身高区间与对应的学生数量12,15,18,10与)以后,我们定义下面计算的“值”为该广义集合的复杂程度C

C=-12LOG12/55-15LOG15/55-18LOG18/55-10LOG10/55= 32.5335

如果把以上计算结果乘3.321928,就得到复杂程度的比特单位下的数值=108比特。

复杂程度C的一般公式是:C=-∑nilog(ni/N)

这个复杂程度公式与信息论里的信息熵公式,热力学里的熵公式是一致的(不同场合它的含义不同)。

这个公式可以计算各种各样的广义集合的复杂程度。它远远超出了信息论或者热力学的哪些领域。

6 所以每个明确的广义集合不仅都有一个分布函数,而且根据这个分布函数可以计算出来一个复杂程度的值。这个值在特地的场合对应热力学熵,在另外的场合也可以与信息熵成正比例。熵成为复杂程度的特例。 

7 现在再问为什么“熵原理”是对的?如今,这等于问:为什么最复杂的情况(复杂程度最大)最容易出现?《组成论》里说明:只要你承认高概率的事情容易出现(这几乎是不言自明的公理或者废话),并且承认该广义集合呈现什么结局有随机性,“熵最大”就是它的逻辑和数学推论。原来神秘的熵原理的“基础”就是“高概率的事情容易出现”这个小学生也容易理解的道理的一种体现(统计学中的最大似然原理,小概率原理也是它的推论)!在《组成论》里,我把这个熟视无睹的道理尊为“公理”。好像在垃圾推里捡了个没有姓名的孩子,并且让他高就。

8    显然,扩大后的熵概念(――复杂程度)和熵原理(――最复杂原理)的应用领域也扩大了很多。对于我,要积极宣传这个认识,而这些开拓工作更需要大家做。

---完---

 

 

本文引用地址:http://www.sciencenet.cn/blog/user_content.aspx?id=22567