基于GRU-LightGBM的风电机组发电机前轴承状态监测

于 航, 尹 诗

(中能电力科技开发有限公司,北京 100034)

风电机组常年运行在剪切风、风沙、雷雨、自震等恶劣环境中,机组容易发生各种各样的故障。如果发生严重故障会迫使机组非计划停机,从而给风电场带来巨大的经济损失。因此,对风电机组发电机、齿轮箱、叶片等主要部件进行早期故障识别具有重要意义。发电机是风电机组的核心部件,其主要功能是将机械能转换为电能,由于发电机设备长期处于变工况以及电磁环境中,且风电机组单机容量扩大对发电机密封保护增加了难度。据统计,风电装备的各部件中发电机维修费用占比约30%[1-2]。因此,对发电机故障进行早期有效预警是风电运营商和设备制造商关注和亟待解决的问题。

目前,对于风电机组运行状况的监控,大多数风电场采用主流的数据采集与监视控制系统(supervisory control and data acquisition,SCADA),该系统可以采集风电机组运行状态信息及外部环境参数,监测历史和实时数据[3]。SCADA系统监测的参数超出设定的阈值就会触发警报,是一种固定的越线报警模式,未能兼顾环境变化和机组在运行过程中的老化,当机组发生故障触发报警时,机组故障已恶化到紧急停机状态,无法实现早期的故障预警。通过数据挖掘技术对SCADA数据进行分析是早期故障预警的有效手段之一。文献[4]提出一种基于功率曲线分析与神经网络的故障预警方法,对风电机组的变桨系统和偏航系统进行故障预警。文献[5]提出了一种保局投影、核极限学习机和信息熵相结合的风电机组齿轮箱故障预警方法。文献[6]提出了提出一种结合非线性状态估计与信息熵理论的故障预警算法,对风电机组发电机驱动端轴承进行故障预警。文献[7]提出了一种基于并行化的改进模糊C-均值聚类的风电机组发电机故障诊断方法,能够准确判别发电机的故障类型。文献[8]提出一种针对双馈风力发电机组转子绕组外接电路且自身携带变频器构造的初期不平衡故障诊断新方法,能够诊断发电机转子绕组初期不平衡故障。

温度异常是判断机组大部件异常的重要征兆。风电机组发电机轴承温度随着设备劣化趋势的变化而变化[9]。当发电机轴承出现异常时,其温度参数会偏离正常状态,SCADA系统可以监视和采集机组各关键部件的运行状态参数,通过分析与发电机轴承温度相关度比较高的SCADA数据特征,建立发电机前轴承温度预警模型是有效的故障预警方法之一。

针对以上存在的问题,本文提出了一种基于GRU-LightGBM的风电机组发电机前轴承状态监测方法。GRU神经网络作为长短期记忆网络(long short-term memory, LSTM)神经网络的变种,保持了LSTM预测效果,同时又使结构更加简单,大大减少了训练时长[10]。LightGBM算法是在梯度提升迭代决策树(gradient boosting decision tree,GBDT)基础上优化形成的算法,相较于传统XGBoost等决策树算法具有准确度高、速度快、直接支持类别特征等优点[11-12]。基于LightGBM的状态决策模型预测发电机前轴承异常概率,避免人为设定故障阈值的主观性,提升了模型的可信度和泛化能力。

本文具体建模方法如下:

1)SCADA数据预处理。去除SCADA数据中夹杂着的异常数据;
采用GBDT算法选取与发电机轴承端温度相关的特征参数作为模型的输入,发电机轴承端温度为观测参数,为避免各特征取值范围不同而造成误差,对每个特征进行归一化处理。

2)分别独立采用GRU、LSTM、RNN和BP神经网络建立发电机前轴承端温度残差模型,并对比模型训练精度。

3)采用LightGBM算法建立故障决策模型,避免人为设定阈值的弊端,并对测试机组发电机轴承运行状态进行监测。

风力发电机组发电机前轴承状态监测整体建模方法如图1所示。

图1 整体建模方法流程图

2.1 数据预处理

本文所采用的SCADA数据是河北省某风电场1.5 MW双馈异步发电机组的历史数据。该风电机组切入风速为3 m/s,切出风速为25 m/s。SCADA系统每10 min记录一次运行数据,风速、发电机转速、叶轮转速、风向角、偏航角度、齿轮箱油温等100余个有效数据,共采集该风电场38台机组的历史SCADA数据。

由于风电机组运行环境受机组故障、传感器卡涩、SCADA系统宕机、数据采集接口宕机、数据传输网络等因素造成SCADA数据中夹杂着很多异常噪声数据。因此,首先对SCADA数据进行预处理,以提升后续建立模型的准确性,其详细步骤如图2所示。

图2 SCADA数据预处理流程图

首先,对原始的SCADA数据按照时间先后排序并去除重复数据;
其次,对数据进行阈值、死值、跳变、多点联动的数据清洗,其中:数据清洗的阈值范围见表1,数据死值清洗为30 min内恒定不变的值(除机组状态外),数据跳变为前一时刻和后一时刻跳变10倍或1/10以上,数据多点联动主要为三相电压不平衡、三相电流不平衡、桨叶角度不平衡等具备多测点物理关系的数据清洗;
然后,利用拉依达准则(3σ准则)剔除粗大误差数据,根据正态分布置信区间原理,检测数据值落入 [μ-3σ,μ+3σ]之外时为极小概率事件,属于粗大误差数据应予以剔除。其中μ 为特征参数的均值,σ为特征参数的标准差;
最后,利用滑动平均滤波抑制小幅度高频噪声数据。对正常运行机组对数据进行清洗,清洗前后的风功率曲线图见图3。

表1 特征参数阈值范围

图3 清洗前后的风功率曲线图

归一化处理:GBDT提取的特征中存在不同的量纲和量纲单位,为避免因特征之间量纲不同而影响模型预测精度,需要对特征参数做归一化处理,将特征参数归一化到(–1,1)之间,计算公式如下:

式中:x——SCADA数据参数;

xmean——特征参数的均值;

xmax——特征参数的最大值;

xmin——特征参数的最小值;

xn——归一化后的数据。

特征选择:GBDT是一种集成算法,通过合并多个决策树构建更为强大的模型。一般情况下,选取对观测参数贡献率排名前85%的特征参数作为模型的输入参数。

选取正常机组SCADA数据18 762组为训练数据,7 783组作为测试数据,以发电机前轴承端温度为预测目标,剩余参数作为模型输入特征。设置梯度提升回归树的参数为:树的个数n_estimators=800,最大深度max_depth=100,学习率learning_rate=0.001。训练集精度为0.97,测试集精度为0.83。利用feature_importances_方法可得出各特征重要性结果。重要性排名前85%的特征为:发电机转速、机舱温度、有功功率、风速、发电机后轴承温度、环境温度、A相电流、A相电压、齿轮箱油温、液压系统压力、无功功率、桨角共计12个特征。

2.2 基于GRU神经网络的温度预测模型

LSTM长短期记忆网络结构过于复杂和冗余,GRU神经网络将遗忘门和输入门合并为更新门(zt),同时将记忆单元和隐藏层合并为重置门(rt),从而让整个结构运算变得更加简单,并且性能得到增强[13]。GRU单元结构如图4所示。

图4 GRU单元结构

在机组正常运行的历史SCADA数据中,选取t组特征向量作为输入序列x=(x1,x2,···,xt),通过下式获取两个门控信号,即:

式中:U(z)、U(r)、W(z)、W(r)——权重矩阵;

xt—— 当前t时 刻的输入,经线性变换与W(z)相乘;

ht-1——t时刻之前的隐藏层状态,经过线性变换后与权重矩阵U(z)相乘。

更新门将两部分信息相加并利用Sigmoid激活函数计算得到更新门(zt) ,同理计算得重置门(rt)。

在重置门使用过程中,新的记忆内容将使用重置门储存过去相关信息,其计算表达式为:

式中:W、U——权重矩阵;

tanh——双曲正切函数。

计算最终记忆ht,该向量保留当前单元信息并传递到下一个单元中。此过程使用更新门,其决定了当前记忆内容h′t和前一时间ht-1中需保留的信息,这一过程表示为:

式中:WO——权重矩阵;

zt——更新门激活结果;

yt——门控循环单元最终输出。

GRU神经网络选取发电机前轴承正常的10台机组的历史SCADA数据进行模型训练和测试。选取发电机转速、机舱温度、有功功率、风速、发电机后轴承温度、环境温度、A相电流、A相电压、齿轮箱油温、液压系统压力、无功功率、桨角12个指标的10 min数据最小值、最大值、平均值共36个参数作为温度模型输入,以发电机前轴承温度为温度模型输出。

GRU神经网络输入层有36个神经元,隐含层有3层记忆单元,输出层共1个神经元,激活函数为双曲正切函数,误差选用均方根误差,批处理数量为200,Dropout的值设为0.2。温度模型的训练和测试数据共计25 946条。训练数据样本和测试数据样本的比例为7∶3。同时,LSTM神经网络、RNN神经网络和BP神经网络的参数设置与GRU神经网络相同,对比分析GRU、RNN、LSTM、BP神经网络的发电机前轴承温度模型训练精度和训练时间,结果见图5。

图5 4种算法的训练精度和时间

测试结果表明:GRU神经网络、LSTM的r2较高,表明GRU神经网络和LSTM神经网络的拟合效果优于其他2种神经网络。但是GRU神经网络在时间上明显优于LSTM。综合来看GRU神经网络优于其他3种神经网络。

2.3 基于LightGBM的发电机前轴承故障决策

LightGBM算法采用直方图算法和带深度限制的Leaf-wise决策树生长策略,在实验中采用了数据采样和数据抽样,使模型在不降低准确率的前提下,降低内存占用1/3左右,训练速度提升10倍左右,具有更高的训练效率和更高的准确率[14]。

风电机组发电机前轴承温度残差按时间序列计算每一天的最大值、最小值、标准差、均值、方差、中位数和极差。将异常时间段的残差标签标记为1,将正常时间段的残差标签标记为0。残差最大值、残差最小值、残差标准差、残差均值、残差方差、残差中位数、残差极值为特征,标签为1(异常)和0(正常),将残差特征和标签输入LightGBM算法中进行训练得到基于LightGBM算法的故障决策模型。

发电机前轴承是否异常评判标准为:LightGBM决策模型是基于决策树算法的,而分类型决策树在叶子节点上的决策规则是少数服从多数,也就是基于“不纯度”。某一类标签在叶子节点上的占比越大,则叶子就越纯,分枝就越好。根据LightGBM模型对标签预测的概率进行判定,当模型输出对某一类标签预测概率超过50%,则判定属于哪一类。发电机前轴承异常概率越大,则模型输出概率越靠近1(异常)。发电机前轴承正常概率越大,在模型输出概率越靠近0(正常)。因此,将预测概率0.5作为阈值,当模型预测概率为1(异常)标签时预测概率始终在阈值之上,或者偶尔在阈值之下,立马反弹到阈值之上,则可判定为发电机前轴承异常。反之,如模型输出在阈值之下且无反弹,则判定为发电机前轴承正常。

本实验所采用的SCADA数据是2.1节提到的河北省某风电场的历史数据。共选取该风电场1.5 WM双馈异步发电机组共38台,包括24台正常机组历史SCADA数据,14台异常机组历史SCADA数据。正常机组中,选取2019年2-11月的10台稳定运行的历史SCADA数据共181 622组,按2.2节方法建立温度残差模型。其余机组样本选取任意连续1个月无故障的历史SCADA数据。异常机组选取故障发生前1个月的历史SCADA数据。

将建立温度残差模型的SCADA数据,采用2.1节预处理方法进行数据预处理,样本按7∶3分为训练样本和测试样本。将特征参数输入GRU神经网络预测发电机前轴承温度,以发电机前轴承温度实际值与发电机前轴承温度预测值之差为残差值。计算预测值、实际值及残差见图6。

图6 基于GRU神经网络的模型测试及温度残差

按照2.3节发电机前轴承预警策略训练故障决策模型。将正常的10台机组编号为07#、09#、23#、31#、32#、41#、65#、66#、71#、81#,异常的10台机组编号为69#、10#、84#、88#、99#、15#、96#、86#、13#、70#,共计20台机组。首先按2.1节数据预处理方法进行预处理,然后将选取的特征输入到GRU温度残差模型,预测发电机前轴承的温度,并计算残差值,计算残差如表2特征指标作为LightGBM决策模型的输入。

LightGBM模型在测试集上的预测效果混淆矩阵见图7。模型的分类准确度为0.85。

图7 LightGBM模型预测结果混淆矩阵

选取编号为08#、14#、11#、52#的正常机组和编号为37#、67#、91#、85#的异常机组验证LightGBM故障决策模型。

08#机组取选取2019年3月1日-2019年3月30日的数据;
14#机组选取2019年3月8日-4月4日的数据;
11#机组选取2019年9月16日-10月16日的数据;
52#机组选取2019年4月2日-4月30号的数据。

37#机组由异常检修记录得知在2019年4月28日巡检时发现发电机轴承振动大,需要更换发电机轴承。67#机组在2019年4月28日巡检过程中发现机组发电机振动大,经厂家检查发现发电机轴承电腐蚀严重,振动导致平衡环存在轻微开裂迹象。91#机组2019年4月28日发生发电机温度故障,85#机组2019年10月14日发电机轴承更换。

首先,通过2.1节方法对08#、14#、11#、52#,37#、67#、91#、85#机组数据进行预处理和特征选择,将选取的特征输入到GRU温度残差模型得到发电机前轴承端温度残差。然后,按表2计算残差特征,将正常机组标记为0,异常机组标记为1。最后,将残差特征输入到上述训练好的LightGBM故障决策模型进行预测。预测结果见图8。

图8 预测热力图

表2 残差特征及标签

37#、67#、91#、85#4台机组预测热力图概率大部分集中在阈值(0.5)以上,4台机组判定为异常机组。

08#、14#、11#、52#4台机组预测热力图概率大部分集中在阈值(0.5)以下,4台机组判定为正常机组。

为在风电机组发生故障停机前预测出风电机组的异常运行状态,本文以风电机组发电机前轴承为研究对象,做了以下研究:

1)对SCADA数据进行预处理,通过GBDT算法提取与风电机组发电机前轴承温度特征相关性强的特征变量。

2)采用GRU神经网络建立发电机前轴承温度预测模型。并和RNN、LSTM、BP神经网络模型进行对比分析,在同等条件下,GRU神经网络综合性能优于RNN、LSTM、BP神经网络。

3)采用LightGBM算法建立残差决策模型,并对4台异常机组和4台正常机组残差进行测试,8台机组均判断正确。该方法可有效识别风电机组发电机前轴承运行状态,能够避免人为参与阈值的设定,可在故障前一个月识别出发电机前轴承的异常状态。

猜你喜欢 残差发电机轴承 基于残差-注意力和LSTM的心律失常心拍分类方法研究成都信息工程大学学报(2022年2期)2022-06-14用于处理不努力作答的标准化残差系列方法和混合多层模型法的比较*心理学报(2022年4期)2022-04-12融合上下文的残差门卷积实体抽取北京大学学报(自然科学版)(2022年1期)2022-02-21笑声发电机故事作文·高年级(2021年12期)2021-12-21发电机少男少女·小作家(2021年8期)2021-09-13接触式密封在大功率半直驱永磁风力发电机应用探讨123中国电气工程学报(2020年3期)2020-07-31小番茄发电机红领巾·探索(2020年2期)2020-05-19基于深度残差网络图像分类算法研究综述①计算机系统应用(2020年1期)2020-01-15斯凯孚展示用于电动汽车的先进轴承产品汽车与驾驶维修(维修版)(2019年7期)2019-09-10一种轴承拆卸装置的实用设计科技风(2018年23期)2018-05-14

推荐访问:发电机 机组 轴承