气候概率分布理论的新内涵及其展望

                      丁裕国(dygnim@jlonline.com)

           (南京信息工程大学,江苏省气象灾害重点实验室)

本文受国家自然科学基金项目40675043和江苏省气象灾害重点实验室基金项目(KLME050209)资助。作者(1941年生)南京信息工程大学教授,长期从事统计气候和气候变化研究.2007年发表在沙漠与绿洲气象杂志第1卷第2期1-5页

摘要:近年来,国内外学者关于气候概率分布理论和应用的研究已经取得了许多新的成果,本文简要回顾近年来这一领域已经发展起来的新内涵,并提出未来可能的研究设想。

关键词:气候概率分布理论;气候变化;熵理论;空间域上的概率分布模式。

1.引言

概率分布理论是一切概率统计学方法最重要的理论基础。全面描述变量的随机性可用某种概率分布,由于不同气象变量其随机性并不一样,它们必然对应着各自不同的理论分布模型。实践表明,气候观测记录所蕴含的各种信息不论在什么时空尺度上都具有不确定性即随机性。比如,某地月平均气温为正态分布,而月降水量却可能是非常偏态的分布。而一切统计推断的理论前提都离不开基本的统计模型——概率分布。研究如何根据观测资料去推断随机现象概率特征(如概率分布)的理论和方法是数量统计学的中心任务。气候观测记录的集合就是样本,以有限的样本去推断总体特征就是统计推断[1]

早在80年代,张学文等人就已指出,以时间域的频次为考察对象的单个测点的气象要素概率分布与以空间或质量占有数为对象的气象要素场空间概率分布,两者并无本质区别,实为一个问题的两个方面。由此就将气象或气候概率分布的内涵扩展为时空域上的概率分布理论[2]。所以,广义地说,任何时段或时刻的某一气候变量场,例如,地理空间上观测到的同一时刻某一种要素取值的概率特征(如某种量级的占有数)也是气候概率及其分布的研究对象。事实上,人们永远不可能无限精确地度量任何区域上无数个测点的气象要素取值,而只能从中抽取有限数量的测点给出一定精度的观测值,这就必然涉及到要以变量的样本场分布函数来推断总体场分布函数的问题。

尽管直到目前为止,这一学术观点尚未受到人们的普遍重视,但在地球科学和大气科学中的许多分支学科已经得到了有力的证明。例如,为了描述地表各种物理参量在地理空间域上的非均匀分布,在陆面过程参数化研究中对某种参量构造次网格尺度空间域的概率密度函数(PDF)作为表征非均匀性的积分算子,已成为一种行之有效的方法[3-5]

    笔者在研究气象要素(如降水)空间分布的过程中发现,描述气象要素空间分布非均匀性的最佳方法就是拟合其空间域概率密度函数(PDF),即气象要素与其占有面积具有某种函数关系[6]。在一定的条件下,还可证明空间分布函数与时间分布函数的等价性。

早在90年代初笔者与张学文就在《中国气象报》刊文呼吁“重视气候概率问题的研究 [6]。近年来,国内外学者关于气候概率分布理论和应用的研究已经取得了许多新的成果,本文一方面简要回顾近年来这一领域已经发展起来的新内涵,另一方面提出未来可能的研究设想,以供有兴趣的读者参考。

2.气候概率分布理论及其应用的新内涵

1)气候变化的概率意义

在气候变化的历史长河中,某一定时期内的气候总是围绕着某一平衡态而振荡,气候从一个平衡态转入另一平衡态的过程,正是气候状态发生变化的过程。从统计意义上说,这种变化必然反映在其相应的概率分布变动上。对于给定时段来说,概率分布可以全面描述某一气候变量观测取值的频率特征,而一旦概率分布发生变动,则必然可从中检测出气候变化的信号[7-10]。例如,考虑辐射强迫因子时,1×CO2(当代气候)和2×CO2(未来气候)两种气候情景下,气候异常事件的概率(或频率)分布可能会发生三种类型的变动:其一,概率分布形式不变,但均值可能改变;其二,均值不变但方差发生变化;其三,均值和方差同时都有变动或概率分布形式改变。显然,上述概率分布参数的变化,意味着其围绕平衡气候态的概率分布模型有了改变。然而,通常全球粗网格尺度的气候数值模拟只能预测出平均的气候状态在时空域上的变化,目前尚无法直接模拟出气候的极端状况。因此,假如未来全球平均气温上升1℃,各地夏季高温≥某临界值的日数将如何改变?在1个月内至少有一个超过临界高温的“游程”(例如>5天)的机会有多大?诸如此类的问题,仅从气候数值模拟结果是无法准确获得的。例如,平均温度若仅有很小的变化,却可能导致极端温度事件概率产生较大的变动。就变量的概率分布而言,极端气候的强度、频率等特征参量的变化本质上是原变量概率分布的两端尾部型态特征的变化,就变量的时间演变记录特征来看,它们又反映了气候序列内部结构的变化。换言之,假如我们能够对平均气候状况作出较为准确的预测,必然可以借助于描述极端气候变量的概率分布模型对其发生的概率及其分位数作出可信的预测,当然也可从随机过程和时间序列分析其极端值演变特征与规律。20世纪80年代以来, 不少学者通过随机统计模拟的方法,研究全球气候背景变化情景下的气候极值问题, 如Means等(1984)研究指出,气候要素原始分布的均值变化可导致极值频率和强度呈非线性变化,即平均气候的微小变化可能引发极端气候值出现频率的很大变化;Katz和Browns(1992)则从理论上证明,原始分布的方差变化对于极值频率的影响要比平均值的影响大得多[9,10];Groisman等(1999)及Easterling等(2000)都指出[7,8],由于降水量为Gamma分布,不但平均值的变化改变其方差,而且降水方差的变化又影响极端降水发生的次数,从而造成总降水量增加时降水极值出现机会呈现非线性增大。由于极端降水变化主要与相应变量概率分布的尾部特征有关。近几年来,笔者(2002,2003,2004)利用实际观测资料,在适当的概率分布模式基础上,考察了我国一些代表性测站冬夏极端气温出现概率对全球气候变暖的敏感率,估算极端降水统计特征量与总降水量的关系。尽管关于平均气候与极端气候的非线性统计关系已经有了一些研究成果,但其研究毕竟还缺乏系统性和深度[11-18]

  上世纪中期,人们早已证明有三种类型的渐近极值分布可用于气候要素极值的频数分配拟合,其中第一型(又称分布型)应用最为普遍[19]。但是,以往的研究仅仅考虑在全球气候背景不变(即平均气候不变)条件下,天气气候极值的概率问题。自20世纪70-80年代以来,不少学者将天气气候极值与气候变化问题相联系,提出了全球气候背景变化下的气候极值问题[7-10]。自从关于全球气候变化的第2,3次评估报告公布以来,极端天气气候事件已成为气候变化研究的热点问题[20,21]。近年来,国内对于这一领域的研究也日趋关注,但笔者注意到,多数研究仍都偏于应用经典极值分布(如分布)及其参数估计方法(如经典矩估计)诊断气候极值的时间域概率问题,而很少考虑气候极端值的时间域和空间域双重概率问题。因为气候极端事件是引发气候灾害的基础,以往仅只考察某一时段内的气候最大值问题显然有一定的局限性。在这一领域尚有相当的问题需要深入研究。

2)气候变量在空间域上的概率分布

过去有的学者认为,用概率分布来描述气候要素的取值及其频率状况似乎太经典太落后了,其实这只是一种误解。至于用概率分布函数及其统计参数来描述各中气象气候要素(如降水量、温度)在地理空间域上的非均匀分布,以此作为一种有效的度量指标则也少有人问津。其实,许多地学学科和生物学科的研究中都大量采用了概率统计的指标,其中不乏有相当理论价值和实际意义的创造性成果。大气科学作为地球科学的一个重要成员,接纳更多的各学科优秀学术思想才能在其自身领域中百花齐放,更有力地推动其向前发展。例如,降水量空间分布的不均匀性及其在时域上的变率差异,直接影响着农业和其他生产活动,而日降水量大小或其在空间上的分布与其占有面积之间所遵循的某种函数关系,从概率统计学意义上完全可以用相应的概率密度函数(PDF)来表示。最近张学文对此有更新的论述[22-28]。这实际上是气候研究的一个重要内容。它对防汛、水利工程设计等都具有实用价值。关于日降水量在时域上的变化及其概率密度分布函数的研究工作,由很多学者都做过这方面的工作:幺枕生教授[29]曾给出了大于某种临界值(下限值)的日降水量的分布函数为截断负指数分布。80年代初廖树生[2]从统计力学的角度到除了单站过程降水量r的概率分布函数为负指数关系;张学文[2]从熵极大原理的角度出发导出了一个一次降水过程中降水强度的概率分布函数也为一种负指数分布型。而关于日降水量在大范围(中国区域)空间分布型的问题尚未有人研究,笔者基于这个方面,进一步探讨了关于日降水量在全国范围内水平空间范围上这种分布的非均匀性问题[30-36],曾引进洛伦兹曲线和基尼系数来说明这种非均匀性,并尝试用一种分布函数来拟合这种空间上的概率分布型,在此基础上研究分布函数参数的变化及其气候意义,这也可为陆面过程和气候研究工作提供必要的基础。

事实上,Avissar和Pielke(1989)以及Entekhabi和Eagleson(1989)早就注意到陆面过程中的地表参量非均匀性问题,Avissar和Pielke(1989)提出了解决非均匀性的Mosaic方法,Entekhabi和Eagleson(1989)则提出了利用概率密度函数(PDF)描述地表物理参量空间分布非均匀性的统计-动力方法[3-5] ;其后,不少学者又相继提出过类似的方法或改进方法[3-5]。Giorgi(1997)提出陆面模式中地表非均匀性的一种简化理论描述方法——用对称的概率密度函数(PDF)拟合某一气象要素的空间分布,并将其简化为非均匀积分算子纳入求解通量的方程。借助Cabauw、HAPEX和ARME的实验资料,对这种方案的有效性和敏感性进行了实验,结果表明方案的可行性程度较高[3-5]。但迄今为止, 上述这些方法需要进一步完善,而国内在这方面的系统性研究尚不多见。目前愈来愈多的研究表明,将地表参数或大气强迫因子的水平空间分布的非均匀性用某种概率密度函数(PDF)加以解析描述,并以数值积分算子的形式纳入通量计算的物理动力方程中从而有效地计算出非均匀陆面的区域平均通量,已形成了一类统计~动力学方法。其优点在于:它可将各种地表通量的次网格尺度变率,表征为隐含少量统计参数的统计-动力方程,从而显示出良好的效果和应用前景。但这类方法必须已知各种地表物理参量的非均匀分布特征,相应PDF解析表达式。从理论上说,借助于PDF的适当形式可以对各种地表物理参量的非均匀性作出严谨的数学描述。且与动力方法相结合就能解析地表达网格区平均通量,从而有益于改善LSM的参数化。但是,如何选择恰当的PDF作为陆面变量非均匀性的描述函数是一个关键问题[3-5]。在这方面,许多学者都作了大量的试验,如Arissar(1992)曾用了Gauss分布[13];Clark(1981)曾用了指数分布;Warrilow等人(1986)曾用了指数分布拟合降水强度;而Entekhabi和Eagleson(1989)及Famiglietti和Wood(1994)提出了Gamma分布描述土壤水分和径流[3-5];丁裕国等自2002年以来先后利用Gamma分布,WEIBULL分布和负指数分布拟合了降水量、降水日数、径流和蒸发等各种地表参量的地理空间分布函数,取得较好效果[30-36]。可见,如何准确地定量化描述次网格尺度地表非均匀性特征,将其加入到陆-气耦合模式中,从而寻求一种既简单有效且又有普适性的非均匀地表通量参数化方案,对于真实描述陆面过程, 完善天气气候数值模式的模拟功能,具有极为重要的科学意义与应用前景。

3.对该领域的展望

1)建立统计气象学体系的基础

 如上所述,若将熵理论进一步深化,由最大熵原理提出一定的约束条件而导出任何气象要素场和气象要素的最可几的概率分布模式或必然的概率分布模式是完全可行的。这不但可使统计气候学中最基本的工具加以理论化,从数学和物理成因上解释气候概率形成的原因,而且可以将概率分布理论与气候变化联系起来。笔者就注意到,张学文(1992)在其《熵气象学》一书中已经提出了用概率分布函数的变化来研究气候变迁,并指出:气候变迁可分两类,一类是分布函数的解析式完全变了,另一类是解析式不变,但解析式中的有限的几个参数的数值变了。这一思想与当前国际大气科学界普遍认为气候状态发生变化的过程即气候变化过程,从统计意义上看,就是其相应的气候变量概率分布的变动结果,是完全一致的[2]。而且,笔者更认为下列学术观点非常重要:从全球气候变化的整体观点出发,将任一时刻(或时段)的气候变量分布函数视为某种约束条件下的熵极大所得到的气候状态,由此可见,各种不同时间尺度的气候变化归根到底就是气候沿着“熵极大”的特征量演变的结果,这完全可以类比为气候的能量平衡模式中,气候是沿着能量平衡点演变的[2]

2)构建统计-动力气候学框架

   目前,人们对地球气候的形成和变化有了新的认识。“气候”的概念已不再是经典气候学定义的那种所谓“天气状况的平均”或“大气瞬时状态的长期平均”等“静态”概念。气候的形成是全球气候系统(包含天气、海洋、冰雪、陆面及生物各子系统)内外部多种因素错综复杂的相互作用的结果。由于其相互作用过程随时间的推移处于无休止的变化之中,它们涉及到各个子系统内部以及各子系统彼此之间的各种动力的、物理的、化学的和生物的过程,由此导致气候的长期平均状态和偏离平均态的各种时间尺度的变化。除此以外,整个地球气候系统还会受到各种来自天体运动和地球内部运动的渐变或突变因素的冲击而对其施加各种外部强迫,例如地球轨道参数变化、火山爆发、太阳活动等等。因此,全球或任一地(点)区的气候状态在不同的时空尺度上始终是变化的。自从混沌理论和非线性动力学理论问世以来,动力学系统“内在随机性”的存在,使得确定论不再占统治地位,它与随机方法论之间的鸿沟已经逐步填补。从辨证唯物自然观来看,确定论的数学模型只是纷繁复杂的大自然现象因果规律的一种理想化描述。在现实世界中,“量”的方面的数学的无穷性,比起“质”的方面的无涯无尽性来说,是极为粗浅的。无论怎样复杂的方程式都不可能是实际现象的无限复杂性的等价反映,它们充其量不过是相对精确或相对逼真地描述了现象,而不是现象本身的全部写照[37]。因此,早在20世纪70年代中期,Hasselmann (1976)和Paltridge(1975) 就分别从两种不同的思路提出了统计和动力相结合的所谓 “随机-动力气候模式”。尽管这两种不同的随机-动力气候模式,其思路有所区别,但在数学处理上都具有共性。那就是它们都涉及到统计物理或统计力学中用以描述布朗运动的Fokker-Planck方程及其变量的概率分布密度的时变特征。也有一种观点认为,将气候状态与N维相空间的对应点联系起来,从而将求解Fokker-Planck方程变为求解平衡态概率分布的问题[38]

然而,求解Fokker-Planck方程最关键的问题是首先要估计气候系统变量的概率分布密度及其随时间的变化,它实际上描述了气候物理系统状态随时间的演变过程。由于种种原因,到目前为止,这一问题还有许多难点未能解决,随着概率分布理论的深入应用,笔者相信,借助于目前日益发展的全球气候系统模式及各种建立在线性或非线性统计变换、随机模拟、Markov 过程等统计降尺度技术的预估极端气候事件发生概率基础上的理论和方法,一定能为完善和改进随机-动力气候模拟提供有力的促进。

4.结语

综上所说,气候概率分布理论及其应用已经取得了许多新的有益成果并发展了不少新的内涵。尽管如此,在这一领域尚有诸多薄弱环节需要大力加强研究。 

参考文献

[1] 么枕生,丁裕国,气候统计[M], 北京,气象出版社,333-463,1990

[2] 张学文, 马力. 熵气象学[M]. 气象出版社,17-67, 1992.

[3] Avissar, R., Conceptual Aspects of a Statistical-dynamical Approach to Represent Landscape Subgrid-scale Heterogeneities in Atmospheric Models, J. Geophys. Res., 1992, 97, 2729-2742.

[4] Entekhabi,D and P.S.Eagleson, Land Surface Hydrology Parameterization for AGCM including Subgrid Scale Spatial [59] Variability, 1989, J.Climate, 2, 816-830

[5] Giorgi, F. ,An Approach for the Representation of Surface Heterogeneity in Land Surface Models. Part I: Theoretical Framework. Monthly Weather Review. 1997 vol.125.  P1885-1899.

[6] 张学文, 丁裕国, 中国气候概率研究值得重视1993年8月16日中国气象报三版)

[7] Meehl, G.A.,Karl,T.R.,Easterlling,D.R. etal. An introduction to trends in extreme weather and climate events: observations, socioeconomic impacts, terrestrial ecological impacts , and model projections, Bull. Amer. Meteor. Soc.,,2000, 81(3), .413-416

[8] Easterlling,D.R,etal., Observed variability and trends in extreme climate events:a brief review, Bull. Amer. Meteor. Soc. ,2000, 81(3), .417-425

[9] Means and Katz R.W. , Extreme high-temperature events in their probalities changes in mean temperature. Climate and Appl.  Meteo,  1984,23(2):1601-1613

[10] Katz,R.W. and B.G. Browns , Extreme events in a changing climate: Variability is more  impotant than averages ,Climatic Change,21,289-302,1992

[11] 丁裕国, 刘吉峰, 张耀存, 基于概率加权估计的中国极端气温时空分布模拟试验,大气科学,2004,28(5),770-782.

[12] 张耀存,丁裕国.降水量概率分布的一种Gamma型通用模式[J].气象学报,1991,49(1):80-83.

[13] 丁裕国,程炳岩.中国夏季月降水量概率分布模式的研究[C].气候学研究统计气候学.北京:气象出版社,1991:94-103.

[14] 丁裕国,张耀存.逐日降水过程的随机模拟实验[J].南京气象学院学报,1989,12(2):146-154.

[15] 魏 锋,丁裕国,张小明,姚玉璧, 基于概率加权估计的西北地区极端降水时空分布模拟试验,地球科学进展2005, 20(5), 65-70.

[16] 程炳岩,何卷雄,丁裕国,2003,全球变暖对区域极端温度出现概率的影响,热带气象学报,19(3),429-435

[17]王大钧,程炳岩,丁裕国, 2003,气候平均状况的变化对气候极值出现概率的影响, 南京气象学院学报,2003,26(2),263-269

[18] 邓自旺,丁裕国,陈业国,全球气候变暖对长江三角洲极端高温事件概率的影响,南京气象学院学报,2000,23(1),,42-47。

[19] Gumbel, E. J. (1958). Statistics of Extremes. Columbia University Press, New York, pp.375

[20] IPCC,1996: Climate Change 1995: The Science of Climate Change.Contribution of Working Group I to the Second Assessment Report of the Intergovernmental Panel on Climate Change ,    Cambridge University Press, Cambridge, United Kingdom and New York, NY, USA, 572 pp.

[21] IPCC,2001: Climate change 2001, The science of climate change ,TAR(2001), Houghton J.T.Y.DingD.J.Griggs etal, Cambridge UK: Cambridge University Press.

[22] 张学文、杨秀松,从熵原理得出的暴雨面积和雨量的关系,高原气象,1991,10(3),225-232

[23] 张学文,雨区面积的二项分布,http://qxg.com.cn,2006,3,24。

[24] 张学文,2003,组成论,合肥:中国科技大学出版社,59-158。

[25] 张学文,物理场的熵及其自发减少现象,自然杂志,1986,11期,812-850。

[26] 张学文,大气比湿分布律,气象学报,1987,45(2),251-253。

[27] 马力等,全球大气位温的两个不等价约束及其服从Gamma分布的证明,大气科学,1996,20(6),713-719

[28] 张学文、马淑红、马力,从熵原理得出的雨量时程方程,大气科学,1991,15(6),17-25。 

[29] 么枕生,气候统计学基础,北京:科学出版社,1984, 

[30] 李云,丁裕国,刘晶淼,降水量水平空间分布非均匀性的普适分布律探讨,南京气象学院学报,

  2003,26(2),275-280

[31] 程炳岩,丁裕国等,中国日雨量及其所占面积的函数关系,高原气象2005,24(3),422-427

[32] 刘晶淼,丁裕国,王纪军,非均匀地表陆面过程通量计算的一种简化对称PDF及其应用,  高原气象,

   2002,21(6),583-590

[33] 刘晶淼,丁裕国,周秀骥等,基于降水气候强迫的一种地表径流估计方法,气象学报,2004,62(3),285-293

[34] 王纪军,刘晶淼,丁裕国,2004,用于非均匀地表通量估计的一种积分算子,高原气象,  23(5),605-611

[35] 刘晶淼,丁裕国,李 云等,一种度量区域旱涝灾害严重性的指标,自然灾害学报,135),16-19

[36] Liu Jinmiao, Ding Yuguo,  Zhou Xiuji, Wang Jijun, 2002, Land Surface Hydrology Parameterization over Heterogeneous Surface   for the Study of Regional Mean Runoff Ratio with Its Simulations, A.A.S.,  19 (1), 89-102

[37]丑纪范,长期数值天气预报,北京:气象出版社,311-322。

[38]曹鸿兴,气候动力数值模拟,北京:气象出版社,1-27,123-205。

 

The New Contents of Theory For Climatic Probability

Distribution and Prospects 

        Ding Yuguo   

       ( Nanjing University of Imformation Science and Technique) 

Abstract 

In recent years, theoretically or applied new results of research for the climatic probability distribution have been obtained by many scientists. The new contents in the studies fields are reviewed in this paper. 

Key words: theory of probability distribution for climatology; climate change; entropy theory;

          The probability distribution model for space fields of meteorology.