雨区面积的二项分布

张学文(2006-7-8

摘要:

本文在一定的假设下,得到了区域S中有降水的地区占总面积的百分比x与气象站出现降水的概率p的关系应当是概率论中的二项分布。

关键词:雨区面积,二项分布,降水概率

 

1.       引言:

做天气预告时我们在天气图上分析雨区,并且积累了很多关于雨区的经验性知识。这些知识固然重要,但是关于“雨区”的知识好像停留在经验事实的水平上,它们是否进入理论领域的问题,我们并没有明朗的认识。

水文部门出于洪水预告的需要,数十年前就提出了关于降水的维持时间、占据的面积和降水强度的一般问题,并且称为降水时、面、深问题。水文工作者利用降水资料已经找到了大量的各个特定地域的降水“时、面、深”经验公式,这些成绩推进了工程应用。我们固然承认这些公式多与局地的地域联系,尚不是普遍适用的规律。但是我们应当承认其公式的实用性、承认“降水时、面、深”概念本身已经具有学术价值。

上世纪80年代以来,文献[123]提出了把最大熵原理用到暴雨的时面深研究,这迈出了关于雨区的理论研究的步伐。本世纪初[4] 程丙岩等人利用我国24小时雨量资料的分析,开展了雨区面积的概率分析,它们使雨区研究逐步从经验分析走向理论分析。

2.       一种理论

为推进雨区面积研究走向理论化,这里给出了关于雨区面积的一种一般模型,并且引出了关于(各种)雨区面积大小的一类理论公式。

这里要分析的核心问题是一定区域(如中国)内有雨地区的面积占总面积的百分比x与其出现概率的关系问题。它也容易扩展为雨量≥r占的区域占总面积的百分比x与其出现概率的关系问题,如明天全国出现大暴雨面积大于等于10000km2的概率是多少。

 

3.       稀疏站网概念

面积为S的地区内均匀地分布着N个气象站,它们彼此的距离比较远,以至可以认为任一个气象站发生降水时对其他的气象站是否当时也下雨是无关的独立事件。这样的气象站网我们称为稀疏站网。

4.       稀疏站网上的雨区面积

如果N个气象站在某时刻(瞬时,或者某连续时段)都在下雨,预告员在没有补充资料的情况下,自然认为S就是雨区的面积,即100%的面积都在下雨。由于这些气象站均匀分布在面积S上,所以每个气象站代表的面积是相同的。所以i个气象站下雨,雨区的面积就是S×(i/N),或者说下雨的面积占总面积的i/N

5.       降水概率概念

时间段T内出现降水现象所占的时间为t,根据古典概率定义,那么t/T就是降水现象出现的概率。对每个气象站,只要它有充分长的资料,就可以得到它发生降水的概率。如何从历史气象资料中求这个值,我们不在这里展开讨论。文献[5] 中林之光在分析中国气候时特地分析了一年中出现降水时间所维持的时间的平均值,并且把它称为雨时。把全年的雨时数用全年的小时数除,也就得到了当地的降水现象的出现概率。例如我国的各地的平均雨时t大约是800-900小时,而全年的小时数T365×24=8760小时,所以我国的各地的降水概率(t/T)大约是0.1,即平均地说,你遇到雨的机会大约是10%

6.       稀疏站网内的各个气象站的降水出现概率相等假设

这是一个假设(以后要撤消),我们理解为这个稀疏站网所笼罩的地区是里各个气象站出现降水的概率的差别小到我们可以暂时不考虑的地步。让我们以p代表各个气象站出现降水的概率,例如它们都等于0.1。无雨的概率q显然是1-p,它应当是0.9

7.       只有两个气象站的稀疏站网上的雨区面积的统计规律

在只有两个气象站AB的稀疏站网中,可能出现下面4种降水分布情况

 

 

出现概率

对应的雨区面积

A 有雨B有雨

0.1×0.1=0.01

100%

A有雨B无雨

0.1×0.9=0.09

50%

A 无雨B有雨

0.9×0.1=0.09

50%

A无雨B无雨

0.9×0.9=0.81

0

各种情况合计

1.0

 

得到上面的结果时我们显然利用了独立事件时概率的乘法定理。综合以上情况我们得到

该站网内无雨的概率是0.81,有雨的概率是0.01,有50%的面积有雨的概率是0.09+0.09=0.18。它们恰好是(0.9+0.12这个二项式展开时各项的值。显然这是概率的二项分布的一个特例。

8.       稀疏站网内有雨区占M/N的出现概率公式

从上面的分析我们显然可以引出:N个气象站中有M个气象站在下雨,即,有M/N的面积上有雨的概率p(m)服从二项分布

它是概率论中的二项分布,也就是(p+q)N这个二项式展开的通项。

9.       N=10的计算例子

对于p=0.1的情况,q=0.9,如果站网内有10个气象站,那么可以根据上面公式可以计算出不同雨区面积的事件的出现概率分别为

 

有雨的站点数

出现的概率

10

0

9

0

8

0

7

0

6

0.0001

5

0.0014

4

0.0111

3

0.0574

2

0.1937

1

0.3874

0

0.3486

 

 

它对应的概率分布图是

上面的结果表明最可能出现的情况是10个站中有1个在下雨,9个无雨,其出现概率接近40% ,但是10个都不下雨的概率也高达35% 。而有5个以上的站在下雨的情况的出现概率几乎为零(50%的面积在下雨)。

10初步结论

上面的例子对中国雨区面积的分布有参考价值:平均而言,每天中国大地上雨区占的比例固然可大可小,但是最大的可能性是雨区占全国面积的1/10 ,它恰好是一个气象站出现降水的概率相同。它也提示在降水概率为10%的地区,雨区占全部面积50%以上的情况几乎是不可能出现的。这个结论对我们预告每天的雨区面积显然有重要参考价值。

关于各个气象站的降水概率不相等的情况的理论分析我们要在另外的文章中讨论。

 

参考文献

[1]张学文,暴雨的时面深的理论关系,新疆气象,198112月,12期,1624   

[2]张学文、杨秀松,从熵原理得出的暴雨面积和雨量的关系,高原气象,1991年,10卷,3期,225-232

[3]张学文、马淑红、马力,从熵原理得出的雨量时程方程,大气科学,1991年,15卷,6期,1725 

[4]程丙岩、顾万龙,李云、丁裕国中国日雨量及其所占面积的函数关系,高原气象,2005243422-427

[5]张家诚、林之光,中国气候,上海,上海科学技术出版社,206-222