理解熵概念和熵原理的一个逻辑链
张学文 2007.11.25
不能先学微积分再学整数加减法,这是大家的共识。所以知识的学习、理解要讲究顺序、安排好“知识链”。在小说里,“神”经常是来无踪,去无影,它给人的印象就是不可理喻。科学概念显然不能这样介绍。
现在具体说到对熵概念和熵原理的认识。如果我们介绍熵概念时抓不住核心含义,把熵原理再说得是绝对不可违反的规律,那么大家只好对它敬而远之,而没有从身边的事物体会这个概念和这个原理的重要和作用。
在大学的课程里我曾经3次接触过“熵”,遗憾的是都难领会其核心精神。我后来在漫长的自学熵概念和熵原理的过程中,慢慢的领会到一个理解这些概念和原理的逻辑链,它比一般教科书从热学角度介绍它要好。
我所说的这个逻辑链就是分布函数-熵-熵原理的逻辑链。对于这个认识熵和熵原理的逻辑链我们先是用在《熵气象学》里,后来用到《组成论》一书里,而据王彬(2001,物理与工程,11卷,1期,17-21,大量粒子系统的课程教学体系的探讨)介绍,它也被用到了新的大学物理学教材里。
1.分布函数:
在这里先不谈什么熵,而是先清楚的交代“分布函数”概念。而这个概念在物理学中、在统计学中以及在社会生活中有着数不清的例子。这样就先铺垫了一个十分广泛的“现象世界”(惟象的“规律”)。而对于有点数学基础的人,理解分布函数并不难。简单的说分布函数就是这样一类函数,它告诉你具有不同的标志值(x)的个体(试验)各有多少(y),即函数y=f(x)。例如不同身高的学生各有多少,不同能量的分子各有多少,不同人口的国家各有多少等等。
2.熵:对分布函数的一种运算,它是一个数
有了不同身高的学生各有多少,就可以通过一种运算而求得学生的平均的身高,身高的平均值就是一个特殊含义的数。类似地,对这个资料(这些数据)的另外一种运算(不同标志值占的百分比的对数的加权平均,再乘个体的总数)就得到另外一个特殊含义的量(一个数),它就是体现系统的状态的复杂程度、混乱程度、丰富程度的熵。即熵是对分布函数的一种按特定公式而作的运算结果(它有特定物理意义)。
3. 熵原理:
物质系统的随机性使其熵值总是力图达到它力所能及的最大值。
这不是一两句话可以说清楚的问题。不过你可以把熵最大理解为“在一次实践中,高概率的事件容易出现”的自然体现。而在热力学里的热量自发的从高温流向低温是这个原则的一种体现。所以热力学的熵原理是高概率容易出现的特例。
熵原理是一个极值原理,它配合不同的约束条件就是可以得到不同的分布函数。不仅是热力学里的例如波尔兹曼等这些著名的分布可以用熵最大推导出来,统计学里的很多著名分布函数(如正态、指数、幂..)也可以从这里推导出来。估计,您从实践中发现的那些分布函数都有可能利用它配合特定的约束推导出来(并不排除用其他原理,如动力学等原理)。用不同的约束配合熵原理推导出不同的分布函数是熵原理的应用的十分精彩的应用。它与牛顿定律可以解释自由落体的等加速度运动、手榴弹的抛物线运动、行星的椭圆运动、彗星的双曲线运动有异曲同工之妙。
 
这样联系起来的逻辑链不仅包括了我们对热力学熵的认识,也包括了由E.T.Jaynes 所倡导的最大信息熵原理,并且还可以收罗更多的事例。我感到这个逻辑思路对理解熵、熵原理以及分布函数都是十分精练又省力的。
 
1991年出版的《熵气象学》里我们用这个顺序介绍熵概念和熵原理,以及它在气象学里的应用。而在陈述熵原理时,还列出了信息论里的变换不能使信息增加的原理。2001年王彬教授介绍说这个思路已经贯穿到物理学教材,我自然感到高兴。2002年我在“物理与工程”杂志发的三篇文章也使用了这个逻辑链,它与2003年出版的《组成论》则把这个逻辑链再向前延伸,提出了所谓广义集合概念,从而把分布函数看作是这类集合的必然特征。《组成论》还在理解这个原理方面作了努力,它推荐“一次随机抽样中概率最高的事件是最容易出现(遇到)的事件”为概率公理,而熵原理是它的推论。
 
本文引用地址:http://www.sciencenet.cn/blog/user_content.aspx?id=11564