基于熵和条件生成对抗网络的城市AQI预测研究

文 琴, 何文孝

(内江师范学院 人工智能学院,四川 内江 641100)

随着经济的快速发展以及人民生活质量的不断提高,社会对AQI的关注度越来越高,空气质量下降不仅对人类的健康和自然环境产生巨大的影响,而且在一定程度上会阻碍社会的经济发展,同时加剧对地球的危害.全面地了解和掌握某个城市的AQI及其未来短期内AQI的变化趋势,可为人们的健康出行提供指导,为公众了解空气质量提供途径,为提高人民的环保意识做出贡献,为政府有效快速地做出污染控制措施提供辅助材料.为此,建立科学有效的AQI预测模型尤为重要,并且AQI预测研究已经成为近年来一个重要的研究领域.

近年来国内外许多学者对AQI的预测展开了研究,目前的AQI预测研究中,大多数学者在做预测的时候并未考虑气象因素对AQI的影响,比如:陈岑等[1]提出使用一种基于IG(信息增益)和长短期记忆网络(long-short term memory,LSTM)的AQI混合预测方法对某市的AQI进行预测;
俆乔王等[2]建立思维进化算法(MEA)与支持向量机(SVM)结合的模型MEA-SVM,并将该模型用于AQI(AQI)的预测等;
这些预测都未考虑气象因素对AQI的影响.但在污染源一定的情况下,气象因素是AQI的主要影响因子,因为气象因素如:风场、降雨量、气温等会对污染物进行扩散和稀释进而引起AQI的变化,为此,袁燕等[3]考虑到了气象因素,并将气象因素作为算法设计的基础,提出一种基于社区划分的AQI预测的算法,并且在AQI预测中提高了预测的准确率:万永权等[4]融合了气象参数和污染物浓度对空气质量进行建模预测;
尹晓梅等[5]探究了气象因素对大气污染物的影响进而对空气质量的影响;
综上所述气象因素会对AQI产生一定的影响,因此本文在融入气象因子的基础上再考虑AQI的预测,但是目前在考虑气象因素时,大多学者要么使用历史气象数据作为数据集,忽略了气象预报数据,要么使用单一的气象预报数据作为数据集,对AQI进行预测,这在一定程度上会对最终的预测数据产生影响,本人在前期的AQI预测研究[6]中,提出将气象因子集预报应用于AQI预测中,实验结果表明将气象因子进行集成预报能提高气象因子的预报准确率进而提高AQI的预测精度,为此,在本研究中,对于气象因子仍然采用类似方式即对气象因子进行多模式集成预报以提高预测准确率.

由于城市AQI预测是一个多变量、非线性问题,而神经网络对于这种复杂的非线性关系问题具有很好的处理能力,因此近年来被广泛地应用于空气质量预测研究中.吴慧静等[7]利用遗传算法改进的神经网络对许昌市AQI进行预测,为空气质量的监测、预警与调控提供了科学依据;
方晓萍等[8]利用长短期记忆(LSTM)神经网络对长江经济带AQI进行预测研究;
高嵩等[9]使用机器学习算法对未来AQI进行预测,即使用随机森林模型和卷积神经网络对成都市AQI进行预测;
程蓉等[10]通过对每棵由两个隐藏层和一个输出层构成的三层神经网络回归树对历史空气质量数据进行训练,求平均进行估计,能满足局部空气质量预测要求.这一系列的研究表明将人工神经网络相关的预测模型用于空气质量预测是可行的,且相比于一般的统计模型有利于提高空气质量预测的精度.因此,本文提出一种结合气象因子多模式集成预报的基于条件生成对抗网络的AQI预测模型.

1.1 污染物因素筛选

AQI的变化主要与污染物的排放和气象因素有关.由于污染物的迁移传输需要一定的时间,前一日污染物对当日污染物有较大影响,因此前日污染物可以在一定程度上描述污染源的特征,所以将前一日污染物数据作为影响AQI变化的污染物因子[6].其中污染物因子的筛选参考环境空气质量标准(GB3095-2012),由该标准知二氧化氮(NO2)、细颗粒物(PM 10)、二氧化硫(SO2)、臭氧(O3)、可吸入颗粒物(PM 2.5)、一氧化碳(CO)等六项污染物是引起AQI变化的主要污染物因子,因此将该六个污染物作为本文AQI预测模型的污染物因子.

1.2 基于熵的气象因素筛选

此外,当城市的污染源相对稳定时,气象因素则是影响AQI的首要条件[11].因此,在对城市AQI进行预测时,气象因子的筛选就变得很重要.其次,由于AQI与气象影响因素之间是非线性关系,而信息熵能够解决非线性问题,是量化信息之间相关度的一种有效方法.因此,采用信息熵计算方法来选择影响AQI的主要气象因子,即采用互信息(mutual infonIlation,MI)分析某气象因子与AQI的相关性.

1948年Claude E.Shannon在热力学Boltzmann熵思想的基础上,系统全面地提出信息的度量方法,从新的角度定义了熵的基本概念.Claude E. Shannon利用概率统计方法,将熵作为对某一个随机事件不确定性的数学度量方法,用以计算事件包含的信息量大小.互信息的理论来源于信息论中熵的概念,互信息是用于表示变量之间相关性的一种方法,互信息的大小代表变量间共有信息的多少,变量间的耦合越强,则它们之间的互信息就越大,互信息对各个变量的分布类型没有特别的要求,互信息既能描述线性相关关系,又能描述非线性相关关系,在特征变量选择中得到了非常广泛的研究和应用[12-15].互信息I(M,N)是统计两个随机变量M和N之间依存度的信息度量,互信息的数值越大,则这两个随机变量之间的依存程度就越大,那么它们之间的相关性也就越大[16].互信息的计算公式如下:

I(M,N)=H(M)+H(N)-H(M,N)
=H(M)-H(M|N)
=H(N)-H(N|M),

(1)

公式中H(M)描述的是随机变量M的熵值;
H(N)描述的是随机变量N的熵值;
H(M,N)为随机变量M、N之间的联合熵;
H(N|M)表示在随机变量M已知的条件下,随机变量N的条件熵;
H(M|N)则表示在随机变量N已知的条件下,随机变量M的条件熵.公式中p(mi)为概率密度函数,p(mi,ni)为联合概率密度函数,p(mi|ni)为给定N时M的条件概率函数.

(2)

(3)

(4)

以AQI与气象因素之间的互信息大小来度量气象因素对AQI作用程度的大小,可以消除多元气象因素之间关联耦合所导致的冗余信息,能够科学地表示它们对AQI的影响.其互信息的值越大,则表示该气象因素对AQI的作用程度就越强[17].采用2018年11月到2021年11月的内江市气象要素历史预报数据与同期内江市AQI实测历史数据作为训练数据,然后利用互信息熵对内江市AQI和气象因素进行数据分析,从而得到各气象因素与内江市AQI的互信息熵值.筛选标准:若通过训练后得到互信息熵值的数值小于0.01,则视该气象因子为弱相关,否则,将其筛选为内江市AQI的气象因子.通过实验以及筛选标准得出能见度、相对湿度、气温、气压、降水量、风速、风向对内江市AQI得影响较大(见表1),因此将这7个气象因子作为内江市AQI预测模型的气象因子.综上所述,最终筛选出AQI预测模型的输入因子为NO2、PM10、SO2、O3、PM2.5、CO、能见度、相对湿度、气温、气压、降水量、风速、风向等13个输入因子.

表1 气象影响因素的互信息熵结果

1.3 气象因素的多模式集成预报

在城市污染源相对稳定的条件下,气象因素是影响AQI发生变化的主要因素.因此,为了进一步提高最终预测结果的准确性,筛选出了气象因素之后,还需要对筛选出的气象因素进行集成预报[6].在目前考虑气象因素的AQI预测研究中,大多学者要么使用历史气象数据作为气象数据的预报数据集,忽略了气象预报数据;
要么使用单一的气象预报数据作为数据集,这在一定程度上会对最终的预测数据产生影响.在对AQI预测时,是将前一日的污染物和当日的气象预报因子作为模型输入.由于大气是一个高度非线性的系统,所以各个数值预报的结果对初始条件的微小误差都相当敏感,多模式集成技术在此基础上将各中心模式预报结果进行集成分析以减小单个数值预报模式的系统性偏差.多模式集成预报在一定程度上为未来气象预报的精确度和可信度提供了强有力的依据.多模式集成预报方法,能改进季节气候预测技巧、提高中短期预报准确性、并且方便实用[18],在国际上得到广泛研究与应用[19-20].

表2 气象因素各预报方式的拟合优度

本研究利用长短期记忆(LSTM)神经网络对ecmwf_thin数值预报、japan_thin数值预报、t639_thin数值预报和germany数值预报这4种模式预报进行后处理预报试验,以提高最终预报准确性,本文将预报前各数值预报模式的历史预报数据作为训练数据,通过LSTM神经网络建立多模式集成预报模型.

长短期记忆(LSTM)神经网络解决了循环神经网络(RNN)无法记忆较长时间之前的历史数据情况,即随着时间的推移RNN无法对信息之间的关联进行较有效的学习等问题,所以LSTM神经网络具有对信息的长期记忆能力和学习能力.在气象因素预报中,LSTM神经网络可以通过对过去时刻预报的历史数据进行分析学习后,较好地获取到时间序列中所隐藏的深层次关系,同时又不会产生梯度衰减等现象,该神经网络可以为未来气象要素预报预测打下良好的基础[21].

为此,本研究中将ecmwf_thin数值预报、japan_thin数值预报、t639_thin数值预报和germany数值预报的历史预报数据和实测数据作为LSTM神经网络模型的训练数据建立多模式集成预报模型.通过对2018年11月到2021年10月21日的4种数值预报模式进行训练得到各集成预报成员的权重值,然后用2021年10月22日到11月30日的这4种数值预报数据作为多模式集成预报模型的测试集进行测试.图1为4种数值预报中每种数值预报模式和多模式集成预报模式结果的对比分析.

采用拟合优度作为实验结果评价指标,拟合优度的公式如下,

(5)

TSS=∑(Yi-Y)2,

(6)

(7)

图1 多模式集成预报与数值预报结果对比

由于城市AQI预测是一个多变量、非线性问题,而神经网络对于这类复杂的非线性关系问题具有很好的处理能力,因此近年来被广泛地应用于空气质量预测研究中并都取得了不错得到反响.其中生成式对抗网络(generative adversarial networks,GAN)由生成网络和对抗网络组成,并且是利用这两个网络对抗学习来互相权衡的深度学习模型,其避免了很多难以处理的概率分布问题,因此在图像领域[22-23]、数据集增强[24-25]、自然语言处理等多个领域均有显著的成绩.此外,生成式对抗网络还能挖掘出复杂的非线性问题中所隐含的深层次关系,可提高其预测能力.黄文琦等[26]采用GAN全局和局部生成相结合的方法对变电站工作人员行为进行预测,通过挖掘时间序列信息动态提高了预测能力.王静等[27]利用生成对抗网络对2002—2019年的沪深300指数进行预测,实验结果表明将生成对抗网络用于金融时间序列预测能提高预测精度,同时验证了预测方法的有效性.为了进一步巩固GAN的稳定性以及扩展其应用领域,许多学者在此基础上提出了条件生成对抗网络来解决原始网络存在的部分问题.

GAN由生成网络和对抗网络组成,生成网络通过对数据的真实样本进行学习,从而产生新的样本来“欺骗”对抗网络,对抗网络则通过判断输入的样本是真实样本还是生成网络生成的样本,两个网络通过对抗学习来互相权衡进而优化自身的参数.条件生成对抗网络(conditional generative adversarial nets, CGAN)分别在生成网络和判别网络中额外增加了条件信息c,该条件信息可以是类别信息也可以是其他任何的辅助信息,它可指导数据的生成过程,将GAN从无监督模型变成了有监督模型,其在非线性时间序列中也得到了应用.林珊等[28]提出利用条件生成对抗网络的博弈训练,将负荷影响因素作为条件生成预测负荷数据,进行短期负荷预测,实验结果验证了所提模型可提高短期负荷的预测精度.为此,本研究提出采用基于条件生成网络建立城市AQI预测模型.CGAN的整体结构如图2所示.

图2 CGAN结构

在本研究的预测模型中,图2中z代表随机噪声.c代表CGAN中额外增加的条件信息,即c代表历史AQI数据以及AQI的其他影响因子,其他影响因子在本研究中即为污染物因子和气象因子.x代表真实样本即同一时间段的实测AQI数据,G(z|c)代表生成模型产生的预测样本即预测的AQI数据.L(G|D)代表反馈即网络模型的损失函数.将随机噪声z和条件信息c作为输入因子输入到生成模型,然后生成模型产生预测样本G(z|c).真实样本x与预测样本G(z|c)分别和条件信息c一起作为输入因子到判别模型里进行判别,然后将判别结果分别反馈给生成模型和判别模型.生成模型和判别模型根据反馈结果来优化更新各自的参数,从而提高自身的生成能力和判别能力[28].

在城市AQI预测中,使用历史实测AQI数据、同期历史实测污染物数据、基于多模式集成的气象因子数据建立数据集.其中,历史实测AQI数据作为真实样本,同期历史实测污染物数据、基于多模式集成的气象因子数据作为条件信息.然后将符合高斯分布的随机噪声z和条件信息c作为生成网络的输入因子,生成网络尽可能产生接近真实AQI数据的预测AQI数据,接着预测AQI数据和真实AQI数据分别与条件信息进行拼接输入到判别网络,判别网络判断生成网络产出的预测AQI数据为真实AQI数据的概率,同时还判断预测的AQI数据是否满足条件信息c.图3为基于CGAN神经网络的预测模型.

图3 基于CGAN的AQI预测模型

CGAN的损失函数如公式(8),其中Ex,c(.)代表x分布和c分布的期望值,G(.)表示生成模型输出的数据,D(.)表示判别模式输出的数据.生成器根据添加的条件信息c和噪声z生成一个伪样本.判别器接收伪样本、真实样本和条件信息c,判断接收样本的真假并输出判别结果.整个训练过程归结为生成器和判别器之间的动态的极大极小博弈过程.

lCGAN(G,D)=Ex,c[logD(x,c)]+
Ex,z{log {1-D[x,G(x,z)]}}.

(8)

为了保证预测数据更加接近于真实数据,在损失函数中加入L1损失函数,其中L1损失函数的公式如公式(9)所示:

lL1(G)=Ex,c,z[‖c-G(x,z)‖1].

(9)

为此,算法的损失函数最终定义为:

(10)

公式(10)中:‖.‖表示计算绝对偏差.

3.1 CGAN预测模型的实验结果分析

本研究中将收集到的四川省内江市2018年11月到2021年10月21日的气象因子的历史数值预报数据、污染物的历史实测数据和同期内江市AQI的历史实测数据作为CGAN预测模型和其他预测模型的输入训练预测模型.然后用2021年10月22日到11月5日的数据作为测试集进行测试.选择1.3章节中的拟合优度作为CGAN预测模型的实验结果评价指标.实验结果如图4所示.图4(a)为BP神经网络模型的预测值与真实值之间的对比图,图4(b)为统计分析模型预测值与真实值之间对比图,图4(c)为CGAN神经网络预测值与真实值之间对比图,图正上方R2是计算的预测值与真实值之间的拟合优度,从图中可以看出使用CGAN神经网络模型预测的AQI值与真实值之间的拟合优度为0.933 02,比其他两种预测模型的拟合优度高,由此可见该预测模型的准确率相比于其他两种模型的准确率有一定的提高.

图4 不同模型预测值对比

3.2 结合多模式集成预报的预测结果分析

本研究中将ecmwf_thin数值预报、japan_thin数值预报、t639_thin数值预报和germany数值预报的气象因子历史预报数据和气象因子实测数据作为LSTM神经网络模型的训练数据建立气象因子的多模式集成预报模型.通过对2018年11月到2021年10月21日的4种气象因子数值预报模式进行训练得到各集成预报成员的权重值,然后用2021年10月22日到11月5日的这4种数值预报数据作为多模式集成预报模型的测试集进行测试,得到气象因子的多模式集成预报结果,最后将气象的多模式集成预报结果、污染物因子、AQI历史实测数据作为CGAN预测模型的输入因子对AQI进行预测.实验结果如图5所示,结合多模式集成预报的CGAN模型的预测值与真实值之间的拟合优度为0.940 17,比没有结合多模式集成预报的CGAN模型预测值的拟合优度0.933 02,提高了0.007 15,可以看出将气象因子的多模式集成预报结果作为气象因子的输入在一定程度上可提高AQI的预测精度.

图5 结合多模式集成预报的CGAN模型的预测值对比

为了提高短期城市AQI预测准确率,提出了一种结合气象因子多模式集成预报的基于条件生成对抗网络的AQI预测模型.实验表明,利用互信息熵筛选出气象因子后,再通过利用长短期记忆神经网络对气象因子的4种数值预报数据进行多模式集合预报,有助于提高气象因子的预报准确性;
最后利用CGAN神经网络对AQI进行预测可提高最终AQI的预测精度.

猜你喜欢 气象数值污染物 气象树作文周刊·小学一年级版(2022年24期)2022-06-18体积占比不同的组合式石蜡相变传热数值模拟煤气与热力(2022年2期)2022-03-09不同取样方式下船机污染物排放结果的研究汽车工程师(2021年12期)2022-01-17菌株出马让畜禽污染物变废为宝今日农业(2021年11期)2021-11-27数值大小比较“招招鲜”中学生数理化·高一版(2021年11期)2021-09-05《内蒙古气象》征稿简则内蒙古气象(2021年2期)2021-07-01舰船测风传感器安装位置数值仿真舰船科学技术(2021年12期)2021-03-29铝合金加筋板焊接温度场和残余应力数值模拟舰船科学技术(2021年12期)2021-03-29你能找出污染物吗?少儿科学周刊·儿童版(2021年23期)2021-03-24陆克定:掌控污染物寿命的自由基科学中国人(2018年8期)2018-07-23

推荐访问:对抗 生成 条件