§7.4连续变量的复杂程度公式

我们对广义集合的分析以标志值为离散取值的情况为主线。这符合当代的所谓“数字化”(现代很多电子产品广告中所谓的数字化实际是指用离散量代替连续变化的模拟量)潮流,而公式简单含义清楚也是原因。但是这并不表示对广义集合的分析仅对离散变量适用。实际上弄清了离散情况的问题以后处理连续变化的标志值也很方便。这里引出标志值为连续变量情况下的复杂程度的公式。

前面求代数平均值时曾经用g(x)表示对应的密度分布函数;用f(x)表示相对密度分布函数。即标志值x有单位增量时个体个数的增量。g(x)Δx的乘积对应于标志值出现于xx+Δx区间时个体的数量;f(x)Δx对应于标志值出现于xx+Δx区间时个体数量增加的百分比(概率),参照离散情况时复杂程度公式7.5,可以类比地得到标志值(变量)连续情况时的复杂程度公式应当是(关于处理中某些数学问题与物理思考在第九章中说明)。

(7.7)

在上面的两个公式中都是用积分代替了公式7.5中的求和,而且把对数的符号log改为ln(以自然数e为底的对数)。把对数改为自然对数是因为积分运算中处理的方便(得到的复杂程度就是nat)。积分的上、下限就是标志值可能取的最大值和最小值。

很显然,如果已经知道了连续的分布函数的数学表达式,而且可以做积分,就可以得到一个具体的计算复杂程度的公式。这些公式在下一篇中我们会适当介绍。所以连续变量的复杂程度的计算示例在这里也不介绍了。

§7.5 对复杂程度公式的新理解

第二节指出广义集合的N个个体的标志值都不相同,那么该广义集合的复杂程度为

C=NlogN       (7.8)

这个复杂程度值也是N个个体的广义集合的复杂程度的最大值。我们还得到另外一个结论:各个个体的标志值都相同,则该广义集合的复杂程度为零。

用这两个结论也可以反推出复杂程度公式(7.5) ,这可以加深对复杂程度公式的理解。


由三个球组成的一个广义集合中,有白、灰、黑球各一个。根据公式(7.8),此广义集合的复杂程度C=3log3=1.4313 。如果经过一段时间,黑球变得与灰球的颜色无法区分,广义集合具有的标志值从白、灰、黑变成了白、灰两种颜色。标志值的数量的减少,对应着广义集合内的状态的丰富程度(复杂程度)的降低。利用公式(7.5),计算出其复杂程度为

C=-log(1/3)-2log(2/3)=0.8292

即复杂程度减少了:1.4313-0.8292=0.6021

现在从另外的思路考虑这个问题:两个颜色彼此不同的球变成了颜色相同的球,其复杂程度就从 2log2=0.6021变成 2log(2/2)=0 ,即减少的数量与前面计算的值恰好相等。

这表明N个个体的标志值都不相同时的复杂程度是NlogN ,如果其中有n1个个体的标志值彼此相同,那么其复杂程度就减少n1logn1 。如果有另外的n2个个体的标志值彼此相同,要再减少n2logn2 。所以复杂程度公式也可以写为

(7.9)

从演算中我们也得到了复杂程度公式(7.5)。这表明从新的思路认识复杂程度公式(7.5)):从总的复杂程度NlogN 中减去各个标志值相同的那一部分所减少的复杂程度,就是含有(若干组)相同的标志值的广义集合的复杂程度。

这表明,认可各个个体的标志值彼此都不相同时的复杂程度用NlogN表示,并且认为标志值全同的广义集合的复杂程度为零,那么复杂程度公式(7.5)可以从物理分析中推出。与第七章从一种特殊的平均值的角度引入复杂程度比较起来,现在的思路物理内容丰富,也便与在一些特殊情况直接计算复杂程度。

公式(7.9)是另外一种形式的复杂程度公式。它表明每有n个(n1N)个体的标志值全同,就导致广义集合的复杂程度减少nlogn ,这是复杂程度公式的宝贵性质。我们也可以称它为复杂程度的可减性 

§7.6讨论和小结

大家都熟悉平均值,但是指出过去计算的那些平均值都是对应的广义集合的每个个体的标志值的平均值则是我们新认识。用广义集合多项式计算平均值也是新认识。

本章从算术平均值、几何平均值、调和平均值进而引出从一种特殊的平均值。它由广义集合的分布函数计算出来,恰好有能力描写一个广义集合的内部发状态的丰富程度、标志值的差异程度(在某些场合也被称为混乱程度、无序程度)。我们称它为复杂程度。这种对复杂程度的定义与人们对“复杂”的理解是一致的。

计算复杂程度的公式是7.57.7,它们并不复杂。它们也是本书使用最多的公式。

如果各个个体的标志值都相同,该广义集合的复杂程度为零。如果各个个体的标志值都不同,其复杂程度C的公式简化为C=NlogN N是广义集合内个体的总个数,而这个C 也是N个个体组成的广义集合的复杂程度的最大值。

复杂程度的计算单位与现在计算机界、信息论中广泛使用的计量信息的单位比特(Bit)等单位是一致的。

复杂程度也可以看成是广义集合内不同的标志值在随机抽样中被抽中的概率的一种特殊的平均值。

人们围绕平均值已经做过很多工作了。现在发现一切可以计算平均值的问题中都可以利用相同的资料(实际更少--不要求知道标志值具体是多少仅要求知道有多少不同的标志值和它们对应的个数)再计算该广义集合的复杂程度。这启示我们也可以把复杂程度计算用到很多领域去。

总体的复杂程度≥部分的复杂程度的合计值。

我们总是可以从某种角度(侧面、层次)把客观事物看成是广义集合,每个广义集合又都对应着唯一的一个复杂程度。于是我们又认识到复杂程度也像质量或者能量那样普遍存在于一切事物中。它提示我们复杂程度和质量、能量都是一样的真实,一样的重要。

物质的质量联系着质量不灭定律,物质的能量联系着能量不灭定律,复杂程度也与物质的质量或者能量一样有一个客观规律吗?这是下一篇讨论是问题。在本篇的下一章我们还要讨论复杂程度与信息、熵的关系。

第七章问题:

1.         “复杂”是个经常用的词,应当设计(创立)一个物理量让它描述复杂程度的大小。您认为这个思路如何?

2.         用广义集合的语言说明什么是“平均值”

3.         是否每个广义集合都有平均值,为什么?

4.         列出离散变量的复杂程度公式,解释其物理含义。

5.         举例说明把公式(7.5)计算出来的量(值),称为复杂程度是妥当的。

6.         复杂程度的单位与广义集合的标志值的单位是否有关系?

7.         把一个水分子(H2O)视为一个广义集合,而每个原子为一个个体,其复杂程度是多少?1摩尔(6.02×1023)的水分子的复杂程度是多少?

8.         一付中国象棋的复杂程度是多少?两付相同的象棋混到一起,其复杂程度是多少?

9.         举例说明两个广义集合合并后,其复杂程度比原有的各个广义集合的复杂程度大。

10.     举例说明用公式(7.9)计算复杂程度的思路和过程。

11.     找一组已经计算了平均值的资料,利用它们计算对应的复杂程度,再分析它。

12.     您认为把物质的复杂程度与物质具有的质量、能量并列的提法有什么看法?

--附录:数学说明--

 第八章 回第七章首