基于三参数威布尔分布模型的台风灾害损失研究

倪百秀,赵莉莉,王 颍,李国成

(皖西学院 金融与数学学院,安徽 六安 237012)

台风是我国最常见的自然灾害之一[1],研究台风带来的灾害损失问题意义重大。设计台风灾害损失保险产品能够很好地解决灾害理赔问题,但需要对台风灾害损失的概率分布参数进行准确估计。在台风灾害问题的研究中,大多以个别地区为实例来进行分析研究[2],主要集中在台风灾害经济损失和风险评估方面,如吴亚玲等利用台风灾害对广东省造成的经济损失数据为依据,基于极值理论的POT模型,设计了一种针对台风损失问题的债券[3];
李超超等以福建省台风灾害损失数据为例,运用灰关联度分析法,找出了影响该省台风爆发的主要因素[4];
项瑛等对江苏省主要气象灾害的时空分布和演变特征进行了深入分析和研究[5];
陈楷俊等对近30年粤东地区的台风灾害风险进行了评估和分析[6];
刘合香等利用信息扩散技术实现了对华南极端台风灾害的风险评估[7];
卢耀健等利用模糊随机方法并借助组合权重构建了台风灾害风险评估模型[8];
林江豪和阳爱民构建了BP神经网络台风灾害经济损失评估模型[9];
伍俊杰等利用大数据技术构建了台风灾害经济风险评估模型[10];
邢彩盈等对海南省台风气象服务效益进行了评估研究[11];
王国新和李明鑫通过对风灾致村镇建筑损失的研究评估,构建了台风灾害管理系统[12];
周延和屠海平通过对台风灾害经济风险的评估,设计了跨区域型台风灾害保险基金[13]。在自然灾害损失概率分布问题上的研究成果也较多,如赵珊珊等运用无纲量化方法、归一化法计算了我国气象灾害综合损失指数,分析了各种气象灾害问题带来的损失分布特征[14];
孙伟等以我国地震灾害为例,对其损失分布函数进行研究,发现地震灾害损失分布函数服从泊松分布[15]。

但是,关于台风灾害损失的概率分布问题的研究还不多见。为此,本文将台风灾害损失的概率分布问题作为研究对象,从《中国气象灾害年鉴》和《中国海洋灾害公报》收集我国每年因台风灾害带来的直接经济损失数据,基于极大似然估计法构建灾害损失的概率分布参数估计模型;
利用蜜獾算法(HBA)[16]来求解台风灾害损失的概率分布参数估计问题,该算法通过模仿蜜獾搜寻蜜蜂和挖掘蜂巢的行为形成动态搜寻策略,借助随机优化技术使得种群在搜索过程中始终保持充足的多样性,避开局部极值点,获得全局最优,进而获得较为精确的概率分布模型参数估计值,实现对我国台风灾害损失的概率分布特征的精准刻画。

1.1 变量选取和数据说明

本文将台风灾害损失作为研究对象,以每次台风所带来的直接经济损失设为指标。从《中国气象灾害年鉴》和《中国海洋灾害公报》中搜集2003—2020年我国每年台风灾害带来的直接经济损失数据。将每次台风给相关地区带来的直接经济损失数据进行汇总,获得2003—2020年的台风灾害带来的直接经济损失样本数据共计142个。

1.2 正态分布检验和厚尾性检验

首先,采用正态分布Q-Q图来判断台风灾害损失数据是否服从正态分布。基于2003—2020年的台风灾害直接经济损失的样本数据,利用Matlab 软件(2018b)统计工具箱作出2003—2020 年的台风直接经济损失的正态分布Q-Q图,如图1所示。可以看出,2003—2020年的台风直接经济损失的Q-Q图并不是直线,因而可以推断,台风损失的样本数据不服从正态分布。其次,分别利用Matlab软件统计工具箱的Jarque-Bera 检验和Lilliefors 检验来实现台风损失样本数据的正态分布假设检验,其中显著性水平α设为0.05,检验结果如表1所示。

表1 样本数据的正态分布假设检验结果(α=0.05)

图1 2003—2020年的台风直接经济损失正态分布Q-Q图

表1的正态分布假设检验结果表明,2003—2020年的台风直接经济损失样本数据不服从正态分布。因此,为了探明其服从何种概率分布函数,本文利用Matlab软件统计工具箱绘制出所选样本数据的直方图,如图2所示。可以看出,图形具有明显的“尖峰,厚尾,右偏”特征,即样本数据显示出厚尾性特点,因而正态分布不能很好地拟合样本数据。

图2 2003—2020年的台风直接经济损失直方图

进一步分析样本数据,推断其之所以具有厚尾性特征是因为样本数据中存在个别的极值,影响了样本数据的分布特征,所以,我们考虑分别用极值分布和威布尔分布来拟合样本数据,结果如图3所示。可以看出,威布尔分布拟合效果更好。为此,采用Lilliefors检验对样本数据进行极值分布和威布尔分布假设检验,其结果如表2所示。

图3 样本数据概率分布拟合

由表1 和表2 中的Jarque-Bera 检验和Lilliefors 检验结果可知,样本数据可能服从威布尔分布,图4描绘了样本数据与威布尔分布的概率对比图。

图4 样本数据与威布尔分布概率对比

表2 样本数据的威布尔分布假设检验结果(α=0.05)

由图4 可以直观地看出,样本数据几乎与威布尔分布直线重合,进一步表明我国台风灾害损失样本数据服从威布尔分布,借助Matlab 软件统计工具箱得到样本数据的两个参数威布尔分布的尺度参数β和形状参数η的估计和置信区间,如表3所示。

表3 样本数据的威布尔分布参数拟合结果(α=0.05)

考虑到两个参数的威布尔分布没有体现位置参数,为了更加精准地刻画我国台风灾害损失样本数据的概率分布特征,本文基于2003—2020年的台风灾害损失样本数据构建了三参数威布尔概率分布模型。

对于概率参数估计问题,当样本容量比较少时,一般采用极大似然估计法。针对台风灾害损失概率分布参数问题,统计的样本数据容量较小,所以采用该方法进行研究。本文所要研究的是三参数威布尔分布的参数估计问题。先确定其概率分布密度函数为

其中,β>0为形状参数,η>0为尺度参数,γ>0为位置参数。三参数威布尔分布的似然函数为

其对数似然函数为

传统极大似然估计问题的求解是对对数函数先求导,并令其为零来构建方程组,通过求解方程组即可得到概率分布模型的参数估计值。但是,这种基于梯度的优化算法对于三参数威布尔分布来说特别困难,所以本文将其转化为优化问题,并采用基于仿生学原理的蜜獾算法来进行求解,即利用迭代搜索方法,使对数似然函数值达到最大,从而得到概率分布参数的最优估计。

利用蜜獾算法来求解台风灾害损失概率参数估计问题,其个体构成即为台风灾害损失的极大似然估计函数中的参数β,η和γ,将种群中每只蜜獾的位置设为(β,η,γ)并表示个体解,其适应度函数即为式(3)所表示的极大似然函数,计算如下,

为了验证基于极大似然估计法的三参数威布尔分布参数估计问题的HBA算法的求解可行性和有效性,本文首先构造了1个测试算例,即将威布尔分布参数(β,η,γ)设为(2,3,5),随机抽取5 000个样本构成测试集,然后利用HBA算法求解得到参数β,η和γ的最优估计值,最后分别与灰狼优化算法(GWO)[17]、蝴蝶优化算法(BOA)[18]和哈里斯鹰算法(HHO)[19]所得到的结果进行对比。

实验硬件环境为Intel(R)Core(TM)i3 CPU M2.27 GHz 处理器和2 GB 内存;
软件环境为Windows10和Matlab R2018b。4种智能优化算法的种群规模为40,最大迭代次数为100。考虑到智能优化算法的随机性,将每种算法独立运行30次,从每种算法结果中统计其最优解、平均值、标准差和相应的适应度值(对数似然函数值),结果如表4所示(最好的结果以粗体标识)。

表4 模拟算例的参数估计结果

由表4 可以看出,在4 种算法独立运行30 次实验结果的3 个评价指标中,除最优解中HBA 和HHO并列第一,其他2 个指标都是HBA 的表现最好;
GWO 和HHO 两种算法的表现差不多,BOA 的表现最差,这些结果表明,HBA对三参数威布尔分布参数估计算例的估计结果最为精确。从标准差指标来看,30次独立运行HBA算法的3个参数估计结果的标准差都很小,接近于零,表明HBA寻优性能较为稳定,克服了群智能算法受初始种群随机性影响的缺点。图5 描绘了4 种算法寻优迭代的特征曲线,可以看出:HBA 算法的收敛速度最快;
GWO 算法略微低于HBA;
HHO 的求解精度和前两种算法差不多,但其收敛速度要慢一些;
BOA的求解精度最低,且收敛速度最慢。为了进一步分析这4种算法求解三参数威布尔分布参数估计问题的效果,下面给出了它们参数估计的均方根误差(RMSE)和平均绝对百分误差(MAPE),结果如表5所示。可以看出,在两个参数估计结果的评价指标RMSE和MAPE中,HBA算法的指标估计值都明显小于其他3种算法,再次表明HBA算法能够求解三参数威布尔分布参数估计问题,且估计结果较为准确。

图5 4种算法迭代收敛特征曲线对比

表5 模拟算例参数估计结果的评价

选取我国2003—2020年的台风灾害损失样本数据进行实证,基于极大似然估计法构建三参数威布尔分布模型,并用HBA 算法求解该模型。将本文算法与GWO、BOA 和HHO 等3 种仿生智能优化算法结果进行对比,如表6所示。

表6 4种算法求解威布尔分布参数估计问题的实证结果

可以看出,在4种算法独立运行30次实验结果的3个评价指标中,除最优解中HBA和GWO并列第一,其他2 个指标中HBA 的表现都是最好的;
GWO 和HHO 两种算法的表现差不多,BOA 的表现最差,这些结果表明HBA 算法对台风灾害损失概率分布参数估计的结果最为准确。进一步分析3 个指标中HBA的表现,可以看出30次独立运行的结果几乎完全相同,标准差近似为零,表明HBA算法寻优精度高且较为稳定。

研究台风灾害损失的概率分布参数估计具有重要的现实意义,而准确估计出模型的参数具有很大的挑战性。本文收集整理了2003—2020年的我国台风灾害损失的样本数据,分别利用Jarque-Bera检验和Lilliefors检验对样本数据的概率分布特征进行探究,结果发现其服从威布尔分布。因此,基于极大似然估计法构建三参数威布尔分布参数估计模型,进而将其转化为一个优化问题,利用在复杂优化问题求解中表现优良的蜜獾算法实现该问题的求解,并将其结果与GWO、BOA和HHO等仿生群智能算法结果进行对比。模拟算例和实证结果表明,蜜獾算法更加适合求解台风灾害损失的概率分布参数估计问题,参数估计较为准确,收敛速度也较快。

猜你喜欢概率分布参数估计布尔基于新型DFrFT的LFM信号参数估计算法哈尔滨工业大学学报(2022年5期)2022-04-19离散型概率分布的ORB图像特征点误匹配剔除算法装备制造技术(2020年3期)2020-12-25一种GTD模型参数估计的改进2D-TLS-ESPRIT算法北京航空航天大学学报(2020年10期)2020-11-14布尔和比利幽默大师(2019年4期)2019-04-17布尔和比利幽默大师(2019年3期)2019-03-15布尔和比利幽默大师(2018年11期)2018-10-27布尔和比利幽默大师(2018年3期)2018-10-27关于概率分布函数定义的辨析科技视界(2016年19期)2017-05-18Logistic回归模型的几乎无偏两参数估计统计与决策(2017年2期)2017-03-20基于概率分布的PPP项目风险承担支出测算中国工程咨询(2017年3期)2017-01-31

推荐访问:布尔 灾害 台风