(2001年8月公布于 http://entropy.com.cn

§15.5物质的复杂程度的互相转化现象

明确了有限物质的复杂程度是有限值(不是无限大也不是零)以后,第十四章研究了物质在变化时,其不同形态的复杂程度的互相转化现象。我们提供了一些过去认定的不可逆的物理过程(即热力学熵增加的过程),说明它们的热力学熵和非热力学熵的总和确实守恒。它提示我们在分析物理过程中热力学熵的变化的同时还要分析非热力学熵的变化,并且应当把它们一并考虑。我们希望得出有限物质在发生变化时不同形态的复杂程度的总和具有守恒性的结论,也打算把它归入复杂度定律之中。这些观点是对热力学第二定律的冲击,但是我们承认目前的讨论是不严格的,待深化的。

物质变化时其不同形态的复杂程度的互相转化现象和规律是有待揭示和分析的自然现象和规律。我们认为这是重要的科学问题。

第十四章关于三种变换机构的讨论非常有启发性,它给我们一个很好的角度,让我们看到物质质量的不可增殖、能量的不可增殖和信息的不可增殖是完全对称的。

§15.6关于复杂度定律

基于本篇不严格的讨论我们曾经粗略地把:

  1. 有随机性的客观事物中的复杂程度(熵)总是使自己在一定的约束下最大化的规律,即最复杂原理;
  2. 有限的客观事物在发生变化时,其不同形态的复杂程度(熵)之间存在着互相转化的物理现象而其总量不变化;
  3. 对标志变量做不可逆变换,其复杂程度是减少的。对标志变量做任何变换,它提供的信息是不可增殖的;
  4. 质量、能量和复杂程度之间可以互相转化,其定量关系就是爱因斯坦质量能量关系公式的扩大;

初步认做是复杂度定律的内容。

我们承认这样表述复杂度定律不严谨,而且也可能将来被说明是错误的。我们认为自己的首要任务是科学地提出这个问题,而不是说我们的答案多么合理。能够引起大家讨论这个问题,我们就认为自己完成了一个重要任务。

§15.7连续变量在变换时的复杂程度的变化

第十四章第7讨论了离散变量在变换时其复杂程度的变化问题,得到了在可逆变换中复杂程度不变化、在不可逆变换中复杂程度要减少的结论,但是把连续变量中的类似问题留到了本章。现在对此做说明。

第七章给出的连续变量的复杂程度公式7.7

(7.7)

这里的f(x)是连续变量x出现于单位区间的概率(即概率密度分布函数),N 是个体总数,a,b 是变量x的出现范围。

在离散变量的情况,所谓变换后的复杂程度的变化问题,就是原变量(标志值)x变成了对应的新变量y,然后分析其复杂程度的变化。对于连续变量这对应于原有的变量x依照y=g(x) 的函数关系变成了新变量y以后,新变量的复杂程度与原变量的复杂程度的关系。

由于无论新变量还是原变量,其计算复杂程度的公式是相同的。所以问题在于利用新老变量的关系得出新变量的分布函数。对此在概率论书籍中是有现成的结果的。(参考F.M.Reza, An introduction to information theory, McGRAW-HILL BOOK COMPANY, INC, New york, 1961,212-213等)。

一般地说,如果原变量不是一个而是n个,即有x1,x2,,…,xn,当它们与新变量y1,,y2yn 互相可以进行一一变换,即可逆变换时,如其变换关系为

y1=g1(x1,x2,,…,xn)
y2=g2(x1
,x2,,…,xn)

yn=gn(x1
,x2,,…,xn)

如果这些gi是可微分的,其一阶偏微商是连续的,而且下面的行列式不等于0,即

如果原变量的分布函数用f(x1x2,,…,xn)表示,而新变量的分布函数用f' (y1,,,y2,…yn)表示,那么新变量的分布函数f' (y1,,,y2,…yn)= f(x1x2,,…,xn)/∣Δ∣

上面算式中的Δ就是前面的行列式,而它前后的垂直线,表示是其绝对值。

把这个公式代入复杂程度公式得到

C(y1,,,y2,…yn)=-N∫∫∫f'(y1,,,y2,…yn)ln f'(y1,,,y2,…yn)dy1dy2dyn

C(y1,,,y2,…yn)=C(x1,x2,,…,xn)- N∫∫∫∫[f(x1,x2,,…,xn)ln(1/∣Δ∣)]dx1dx2dxn

C(y1,,,y2,…yn)=C(x1,x2,,…,xn)+NE[ln∣Δ∣] (15.1)

这里用N与符号E[*]的乘积表示后面的积分,E[*]是∣Δ∣的对数在积分空间的数学期望值。

上面的公式给出了有一一对应关系的新变量的复杂程度C(y1,,,y2,…yn)与原变量的复杂程度C(x1,x2,,…,xn)的关系就是原复杂程度加上一个特殊的数学期望值与N的乘积。

以上分析考虑的多变量的情况,如果xy都仅是一个变量,上面的公式就退化为

    (15.2)

如果x,y是线性关系,上面的微商是常数(设为k)。那么的数学期望值就是k的绝对值的对数,即有

C(y)=C(x)+Nln∣k (15.3)

例如,对于正态分布,其复杂程度依公式(7.7)应当是Nln[σ(√2πe)],已经知道学生的体重符合正态分布,当学生的体重以公斤为单位计算时其标准差σ=5公斤,如果把计量单位从公斤改为100克,这就是变量做了线性变换,而且y=10x。此时yx的微商,它等于10,于是公式化简为

C(y)=C(x)+Nln10

当学生人数N=1000时,C(x)=1000 ×3.028=3028 natC(y)=3028+1000×ln10=5330 nat

y=10x的含义就是新变量为原变量的10倍,所以上面的结果的含义是变量放大10倍,复杂程度增加了1000ln10 nat 。即经过这种线性变换,复杂程度增加了1000ln10 nat。细一想把单位变小相当与对事物区分的更细了,其复杂程度自然应当增加。

反之,如果把例子中的计量单位从公斤改为吨,这意味着我们对问题的要求粗糙化了,此时y=0.001x,于是k=0.001,结果复杂程度

C(y)=C(x)+1000ln0.001=3028+1000×ln0.001=3028-6907=-3879 nat

由于ln0.001为负值,它导致复杂程度变小而且竟然出现了负值。单位变大以后,其复杂程度减少在意料之中,但是出现了负值。这个结果直观上看是不能接受的。

无论是前面的理论分析和特例的分析都说明连续变量即使是经受了一一对应的函数变换以后,其复杂程度可以变大也可以变小,还会出现复杂程度为负值的特殊情况。所以对连续变量做变换时一定要很小心。这里面的根本问题是我们在第七章表述的观点,即我们实际面对的物理量实际都应当是离散的。连续函数实际上是离散变量的近似。

有关出现了负的复杂程度(负熵)等问题的说明请看参考文献[18]。

 

§15.8信息在变换中保守性的证明