§11.5 更一般的模型

上一节介绍的模型还可以推广。

如果N个个体(如学生)组成的广义集合中,每个个体出现不同的标志值(学生身高)的概率不相同,要计算

标志值为A1的个体有n1 个;

标志值为A2的个体有n2 个;

标志值为A3的个体有n3 个;

...

标志值为Ak的个体有nk个,

的广义集合的出现概率P (对应于一种广义集合),依照概率的多项分布公式就是 

(11.8)

这里p1p2等等分别是标志值为A1A2等等的对应的出现概率。这里的p1p2等等是事先已经知道的一些常数(没有随机性),而n1 n2 等等则是自变量(有随机性),即各个ni的值不同对应着不同的广义集合(分布函数)。也用类似前面的做法把这个公式两边去取对数,并且做类似的处理,就得到

lnP=C+n1lnp1+ n2lnp2+…+ nklnpk 11.9a

或者写为

11.9b

这里的C仍然是复杂程度。这个公式的形状与前面等概率的公式类似,既复杂程度还是与概率的对数保持线性关系,但是多了各个标志值的出现概率值以及对应的个体的数量n1 n2 等等。

利用复杂程度的公式7.5也可以把上面的公式改写为下面的形式:

11.10

对于所有标志值的出现概率的合计值显然还有一个约束即它应当等于1(概率的归一性):

p1+p2…+ pk=1 11.11

特别地,当各个概率pi都相同时,它意味着每种标志值出现的概率都应当是1/k 。把这个值带入前面公式,注意到各个标志值的个数的合计值应当等于个体总数N ,即

n1+ n1+…+ n1=N

于是公式11.9变成了

lnP=C+Nln(1/k) 11.12

它显然就是等概率情况的公式11.7。这说明公式11.7是公式11.9的特例。

对于本节,可以这样归纳:对于更一般的模型应当用公式11.9。在公式11.9中,我们又一次看到了有随机性的广义集合的出现概率P的对数与其复杂程度存在线性关系,它再一次告诉我们,出现概率高的广义集合,其复杂程度也大;但是要注意到公式11.9左边的C(复杂程度)以后的那些项中也含有自变量(各个ni)和已知量(各个pi)。所以所谓出现概率高复杂程度也大应当是与后面这些具体情况一并考虑和认识才妥当。如何认识与处理的问题后面还要讨论。

§11.6 最复杂原理

上面对各种有随机性的广义集合的模型的分析都得出了复杂程度与概率的对数是线性关系的结论。把数学语言通俗化,就是对有随机性的广义集合,在一次抽样中出现的概率高的广义集合其复杂程度也高。

在第十章我们引入了一个公理:概率公理:一次随机抽样中概率最高的事件是最容易出现(遇到)的事件。

把上面两个结论联系起来,自然得到一个结论:

一次随机抽样中(不是多次之中特选的)复杂程度最高的事件(广义集合,系统、总体)是最容易出现的。或者把话反过来说:最容易出现的事件(客观事物、广义集合)其复杂程度最大。

把它说得更一般一些,就是:

“有随机性的客观事物(广义集合)都自动使自己内部状态的复杂程度在限制条件下达到最大值”,我们把它称为最复杂原理。 

这样就利用概率公理和前面的分析引申出了最复杂原理。即最复杂原理是概率公理以及前面对含有随机性的广义集合模型的分析而得出的逻辑推论。

请注意在表述中我们补进了“在限制条件下”这个词。这种补充不仅使它可以把前面三节的特殊情况都归入限制条件中,而且把后面会遇到的更多的约束条件也综合考虑了进去。对此我们以后再介绍。

研究对象要有随机性。是可以使用最复杂原理一个基本条件。被研究的对象(广义集合)有随机性,意味着我们观察时得到的广义集合就是它的很多个样本中随机出现的一个。它可能出现这一个或者哪一个,而各有各的出现概率。最复杂原理是指出复杂程度最大的广义集合最容易出现。

如果你研究的事物中没有随机性,最复杂原理是用不上的。但是,由于现在的哲学观点认为几乎一切客观事物都有随机性,我们不妨努力分析一下研究对象,很可能它有某种随机性过去却被忽略了。找到了客观事物的随机性,就为引用最复杂原理提供了可能性。

最复杂原理不是绝对正确。由于最复杂原理的正确性是建立在概率基础是的,所以它仅是以一定的概率“正确”,而不是绝对(每次抽样都)正确。当正确的概率高到例如0.99999999或者更高时(最高为1)我们利用它就很放心。正确概率仅为0.7我们可能不大放心。应当说这个原理主要应用在复杂程度对应的出现概率相当高的场合。

前面的弹子球的例子的表中给出复杂程度最高(10)对应的广义集合(5505100分)的出现概率是252/1024,它接近0.25。即利用复杂程度最高做为答案,它正确的概率仅是1/4。如果以复杂程度最高的三个广义集合为答案(有4-6100分),其出现概率就接近0.66了。在统计物理的很多事例中由于个体的个数非常多,复杂程度最高的事件的出现概率几乎与必然事件没有差别。 

买了很多次彩票,始终没有得过头等奖。为什么?因为得头等奖是小概率事件,不是高概率事件。复杂程度高的事件为什么容易出现?因为它不是小概率事件而是高概率事件。

也许有人提出这样的疑问:利用了概率的二项(或者多项)分布公式而得到的最复杂原理是建筑在标志值仅能离散取值的假设上的。如果某问题中标志值是连续变量,这个思路是否行不通了。

这确实是个问题。

我们的回答是:我们始终把每个广义集合所具有的个体的总数N看作是大于等于零的正整数(这等价于认为物质--包括空间和时间,不是无限可分割的),由于每个个体在每个时刻仅能具有一个标志值,所以N个个体在任一时刻具有的不同的标志值的数量最多仅有N个,即不同的标志值再多,其个数也超不过N个。所以用离散变量的二项(多项)分布公式已经概括了标志值为连续变量的情况。

最复杂原理的正确性仅体现在很多次实践中它经常是对的,而不是每次必然正确(正确的机会最高),它与“正方形的面积等于边长的平方”之类的确定性规律在品格上是不同的。

最复杂原理是本书介绍的最重要的原理。下面举一些简单例子以说明这个原理的精神。

§11.7 普通的例子

回11章首