§18.7变量函数的分布函数

18.7.1问题

大家都知道喷雾器,它可以把药水变成雾(很多个小滴)而喷出来。从物理上看,这是一个把整体分裂开的“破碎过程”。与此类似,劈材、剁肉、打碎了玻璃或者挖掘矿石(煤块)、岩石的裂隙、地质学中的断层等等,也都是“破碎过程”。如果把破碎物的总体看作是广义集合,我们会问不同大小的个体各有多少。这就形成了一个分布函数问题。物理过程中形成的个体(小滴、碎块等)有大有小,体现着随机性(可以应用最复杂原理)。这些都逼近我们熟悉的问题:如何得到它们的分布函数。确实,“破碎过程”在气象(云滴)、化工(粉碎)、地质(断层)中都存在,所以这个问题值得重视。

我们曾经分析过“斩乱麻模型”。“斩乱麻模型”把有限的长度的麻线随机分割为很多小线段。我们曾经得出不同长度的线段的数量服从负指数分布的结论(第十二章、第十七章)。

现在的“破碎过程”问题与“斩乱麻模型”有类似性。这提示我们:大小不同的水滴、岩石块、地质断层也应当是负指数分布。

但是进一步的分析就会发现这个答案不够明朗:究竟是不同体积(质量)的个体的数量服从负指数分布?还是不同面积、或者不同直径的个体数量服从负指数分布?

斩乱麻问题中“破碎”的是一条长线。而这里则可能是物体的体积、面积或者长度。究竟应当用那一个作为标志变量?它的物理根据是什么?

要把药水变成雾滴、把肉切开、把杯子打碎、把煤挖出来都需要对物体施加力量--做功。而做功的后果这是使物体增加了很多新的断面。以药水变成雾滴的过程为例,做的功形成了雾滴的新的表面积。而表面积的增加就对应表面自由能(做的功)的增加。很显然,雾滴的表面积的总合应当与做的功的多少成正比例。

不难看出斩乱麻模型中的线的总长度固定,对应雾滴问题中的总能量(做的功)固定。或者说新形成的表面积的总合为固定值应当是该问题中的约束条件。换言之,把斩乱麻模型用到这里时,服从负指数分布的不是个体(如雾滴)的长度(直径、半径)、体积、质量而应当是个体的表面积。看来,一批雾滴(云滴)如果服从负指数分布,以s表示每个雾滴的表面积,那么表面积为不同值的雾滴所占的权重f(用概率密度的语言)应当与s维持下面的关系。

这里的a是雾滴的表面积的平均值。f(s) 也就是雾滴面积的相对密度分布函数。

但是,从测量的技术侧面看,颗粒的直径、特征长度(线径)比较容易测量。于是人们经常提出的问题是不同直径(线径)的水滴(碎块)各有多少,而不是不同面积的个体各有多少。确实,科技工作者经常用很多(如10)网眼大小不同的筛子把一批物料(例如沙子、矿石)从细到粗一一分开。他很快就知道了不同直径的沙子各有多少(得到分布函数)。

如果认定雾滴都是球体,那么它的直径(半径)与其表面积就是平方关系。我们应当利用这种关系把关于面积的分布函数换算为关于直径或者半径的分布函数。或者更一般地说,我们应当找到一种办法(技术)可以求出变量的函数(平方关系是函数关系的特例)的分布函数。

18.7.2一般关系

在前面的例子中,雾滴是球体,其表面积s与其直径x的关系显然是

s=πx2

把这个关系代入前面的分布函数公式得

        18.40

这个公式表示了雾滴的面积s改变单位值时,它对应的雾滴个数的相对改变量(百分比)与雾滴直径的关系。应当注意到这个公式并不表示雾滴直径改变单位值时雾滴个数的相对改变量。现在规定用f(x) 表示以直径计量的分布函数,即f(x)表示直径x改变单位值时,它对应的雾滴个数的相对改变量。为了得到这个分布函数,可以分析某一定量的相对改变量m,它可以有两种等价的写法

f(s)Δs=m=f(x)Δx

另外对s=πx2做微分应当有

Δs=2πxΔx

 所以有

f(x)=f(s)2πx

 如果以b表示雾滴面积平均值a所对应的直径(与雾滴直径的平均值不是一个含义,数值也不相等!),即

  a=πb2

代入前面的关系就得到

     x>0           18.41

这就是关于雾滴直径的概率密度形式的分布函数。

这样就利用变量(面积与直径)的函数(平方)关系和关于一个变量(面积)的分布函数(负指数)推算出了另外一个变量(直径)的分布函数。它应当符合喷雾器喷出的小药水滴的直径的分布规律(不同直径的滴各有多少)。我们曾经利用大气中观测的云滴的实际分布(称为云滴谱)做过检验[14],证明这个公式与实际相符。但是笔者不知道人工的喷雾器的液体小滴是否真的也是如此(欢迎读者验证)。

显然这里得到的分布函数公式的外型与前面介绍的瑞利分布是一致的。请注意,在这里我们仅利用了一个约束条件:变量的平方的平均值是限定值(破碎过程用的总能量为给定值)。另外我们利用了最复杂原理(利用了斩乱麻公式)。与威伯分布比我们是少了一个约束,但是我们多了一个知识:不是变量的1次方也不是3次方或者其他次方,它恰恰是变量的平方,即n=2。所以这里的结论是与前面两节的知识在结果上是一致的,但是思路有差别。不同思路得到一致的结论使我们对这个认识更放心。

 

 上面的个例可以一般化。如果变量s的分布函数为 f(s) ,而变量xs是函数关系,那么关于变量x的分布函数应当是(请参考概率论的书籍)

注意到所有概率密度函数都是大于0的正量,所有上面的公式中的微商(ds/dx)取了绝对值,另外在变量的取值范围内它们还应当是互为单值的函数关系。

如果xs的函数关系是幂函数

s=xn

s服从负指数分布,利用上面的公式可以得到关于变量x的分布函数为

      x>0

这里的常数u,具有变量xsn次方的平均值的含义。在概率论中这就是所谓威伯(Weibull)分布。这样我们又利用变量函数的分布函数的关系把有物理意义的负指数演化为新变量的威伯分布了。

这样我们就根据变量函数的关系也得到了瑞利分布和威伯分布。

18.7.3一般讨论

变量函数的分布函数问题在概率论的书籍中有介绍。另外第十五章讨论连续变量的复杂程度时曾经一般化的讨论过这个问题。那里给出了多元变量情况时的对应关系。而这里介绍的仅是一元函数的情况。

在统计学中还有三个著名的分布函数,它们就是ChiStudentF分布。这些分布与同正态分布有某种函数关系。所以它们也是变量函数的分布函数。由于我们已经利用最复杂原理得到了正态分布,所以,借助变量函数的分布函数思路,这些分布也可以推导出来。即这些分布都可以组织到一个统一的知识链条中去。鉴于这些分布主要是应用于统计检验技术中,而不是直接应用到自然界的客观事物本身。所以这里就不一一说明它们了。明确这些知识可以依靠逻辑关系连接到一起,也就达到了我们的目的。

在第十五章和这里用到的变量的函数关系仅是可以互为单值的函数关系。而有一些变量的关系并不是一一对应的单值函数关系。在物理学研究气体分子运动的速率分布和能量分布的关系就是这样的,物理学家的数学与物理技巧都是很高的,统计物理学中介绍了他们的合理处理。

18.8极值分布