面向合成孔径雷达图像任意方向舰船检测的YOLOv3模型的改进

赵紫稷

(中船重工第八研究院,江苏 南京 211106)

目前,在分析舰船检测算法时,单阶段算法内的YOLOv3算法检测精确度较高,识别速度较快,是以YOLOv2算法为基础综合考虑ResNet与SSD网络结构的改进算法,比以上算法更优。但与R-CNN算法相比,YOLOv3算法问题识别的精确度以及召回率都较低。此次分析可以以YOLOv3算法为基础进行改进和优化,在控制参数应用情况的基础上,提高YOLOv3算法的检测精度,发挥其在船舶检测中的积极作用。

为了确保我国的海洋权益、促进海洋资源的有效开发,加强海面舰船目标检测工作至关重要。现阶段,舰船目标检测主要以雷达一维距离像、合成孔径雷达图像以及无人机和卫星拍摄的遥感图像作为数据来源。此外,为了保证数据分析的可靠性,还要深入分析海面舰船搭载的光电平台拍摄的视频图像。合成孔径雷达作为主动式微波成像传感器可以全天候工作,并且受外在环境的影响较小,即使在云雾、植被比较丰富的环境中仍然可以保证较强的穿透性。因此,合成孔径雷达技术在军事领域以及民用领域都有至关重要的作用[1]。

目前,在开展合成孔径雷达图像技术分析和研究的过程中,国内外研究人员对正常目标检测以及物象识别方面的研究较多,经过多年研究已经形成相对完善的SAR图像舰船目标监测系统。恒虚警算法(Constant False-Alarm,CFAR)是目前应用比较普遍的SAR图像目标检测算法。该算法在应用中需要通过待检测的像素领域信息完成背景分布估计工作,同时需要以恒虚警率为核心计算分割阈值。此外,在研究时可以基于贝叶斯理论开展目标背景像素分类。在实际分类时,以杂波类型为基础应用背景像素分布模型,可以完成对数正态分布、微波尔分布以及K分布计算作业。以背景区域划分策略为基础的研究需要了解划分策略存在的实际差异。一般情况下,单元CFAR、单元平均选大CFAR、可变窗口CFAR等都属于其差异类型。恒虚警算法属于比较完善的理论和实践方法,但是因为计算量比较大,所以还要优化处理,且背景模型的选择具有较强的主观性,在一些复杂背景下可能会导致虚警率比较高。

现阶段,深度学习理论以及优化技术越来越成熟,以卷积神经网络为基础构建目标检测识别模型,可以大大提高目标检测识别效率。目标检测深度模型的构建分为一阶段检测模型和两阶段检测模型。其中,一阶段检测模型需要将多框检测模型以及和YOLOv3模型作为核心,按照输出的特征图完成回归分析后,可以获取目标位置信息、置信度以及不同类别等综合信息。两阶段检测模型在应用过程中需要利用FasterR-CNN进行分析,主要部分是以某一个区域建议网络和以区域为基础的识别网络。RPN网络可以有效筛选候选目标区域。R-CNN开展目标类别分类以及位置精调时具有突出作用。在实际应用中一阶段算法具有较强的实时性,但是检测精度较低,需要根据具体情况进行科学选择。

现阶段,有研究人员已经将深度CNN模型应用在SAR舰船目标检测过程中。对深度模型的有效应用可以解决在SAR图像舰船目标检测过程中的数据问题。在这一方面,我国相关研究人员已经完成了大量的基础性研究,例如有研究人员构建了新的SAR图像舰船检测数据集,在开展图像分析的过程中,需要从分辨率、极化、海况等不同条件出发获取图像。此次研究共获取1 160幅SAR图像,通过构建的OpenSAR分类数据进行公开展示,主要包含10幅大范围海域SAR舰船检测数据集。为了保证数据分析的全面性,还有一些已经发布的图像舰船目标检测数据集中有高分3号卫星和哨兵1号卫星SAR图像。经过统计可以确定,研究过程中的舰船切片共有43 819个[2]。

目前,在深入分析高分辨率、大尺寸场景SAR图像舰船检测数据集时,包含的数据图像信息较多,有31幅高分3号SAR图像,图像内容包含港口、岛礁以及级别不同的海况信息。大多数数据集的格式以视觉目标分类挑战赛标注格式为主,在实际分类中需要通过目标包围盒左上角和右下角像素坐标描述目标垂直框信息,将SSDD作为核心完成SSDD+8参数倾斜框标注格式构建工作,可以描述任意方向的舰船目标。通过8个参数的描述目标以4个顶点像素坐标为主。高分辨率SAR图像数据集中比较常见的标注格式为上下文常见目标(MSCOCO),其与SSDD+相同倾斜框方式包含5 604张高分辨率SAR图像,可以在舰船目标检测以及实例分割验证中充分发挥作用。

此次研究以YOLOv3模型为框架,可以确保垂直框和旋转框图像SAR舰船目标检测模型同时输出,这样在模型检测设计过程中才能准确定义模型参数训练目标方位角区间,同时能提高网络检测的有效性,保证输出垂直框和旋转框预测结果的可靠度。以垂直框和旋转框预测结果为基础描述不同的损失函数,是提高该模型设计效果的重要基础。此外,相关人员还需要根据可能存在的目标方位角估计偏差,利用RNMS剔除重叠目标。以垂直框和旋转框为主,对方位角估计的准确度进行预测和判定,在校正工作完成后,需要通过Tensorflow深度学习框架以及SSDD+与HRSIDSAR目标检测数据集、舰船目标识别数据集对模型的迁移性和适用性进行全面测试[3]。

2.1 YOLOv3模型网络结构

深度学习方法是YOLOv3模型的主要方法,该模型的使用需要利用新的深度网络完成特征提取。这一网络主要为1×1,3×3卷积层,在网络中包含53个卷积层。这一结构图的残差块可以利用ResNet网络残差结构进行研究。在不同层之间需要设计快捷链路以解决深度网络的退化问题,并对网络结构进行深化处理。此外,在YOLOv3模型的应用过程中,需要借鉴FPN特征融合金字塔理念,完成采样以及特征融合作业,输出不同尺度的特征图。特征图主要包含13×13,26×26,52×52 3种尺寸,在开展小目标检测作业时,大尺度特征图可以有效提供分辨率信息。小尺度特征图的主要功能是提供语义信息。在开展大目标检测作业时,可以利用小尺度特征图获取分辨率信息和语义信息。利用不同尺度特征检测有利于提高特征信息提取的丰富度,确保大尺度大目标和小目标综合检测的效果。

2.2 YOLOv3模型算法

2.2.1 损失函数

损失函数会影响网络效果,在开展模型训练时,必须有效调整网络参数,同时要优化损失函数值,确保损失函数值处于最小状态,提高模型训练效果。损失函数主要为以边界框中心点的预测误差和宽高预测误差。此外,置信度存在误差或者分类预测误差也可能会导致损失函数值出现变化[4]。

2.2.2 构建数据集

在深度学习过程中,科学构建数据集是保证最终检测效果的重要因素。数据集的分析质量会直接影响检测效果。因此,必须保证样本数量充足,提取有效的数据特征,确保网络能学习待检测目标的具体特征。在研究过程中,相关人员还要构建舰船目标检测数据集,主要的训练集、测试集、训练验证集、验证集分别为2 800,840,1 200,360。在利用PASCALVOCps数据集格式进行数据处理的过程中,相关人员可以通过谷歌图片、百度图片、数据集等途径获取舰船图像共4 000张。在处理图像尺寸时,可以将其缩放成416×C16的图像,并通过手工标记、批量修改等确保图像中包含边界框坐标和类别信息,最终形成xml文件,然后按照对应比例完成样本随机分配作业,可以获取训练集以及验证集,最终构建数据集。

3.1 K-means聚类先验框改进

在改进YOLOv3模型算法的过程中,完成K-means聚类先验框改进作业后,需要利用YOLOv3模型算法,确保边界框能够准确预测目标物体在图像中的具体位置。一般要先确定9组先验框,在开展深度网络训练过程中,必须调整边界框的尺寸,保证目标检测框的准确性。因此,在开始选择先验框时,必须保证其具有代表性。这是提高预测结果准确度、保障预测效率的重要手段。YOLOv3算法本身的先验框是以COCO数据集中的类别数据为基础获取的,在舰船目标检测过程中并不能完全发挥作用,这就需要根据已经完成构建的舰船目标检测数据集通过K-means聚类算法获取先验框,并利用最优先验框将其分配在不同的尺寸特征图中。

经过标准处理后的K-means方法使用的为欧式距离,这种方法会导致边界框的误差增加。因此,在目标舰船检测算法的应用过程中,比较常用的性能指标交并比可以代替欧式距离,聚类算法使用的公式为:

式中,IOU数值越大,说明检测框和目标的相似度以及相对性越高,判定距离也越近。在计算工作中,假定K值为9,聚类9种尺寸先验框,并按照不同的颜色对先验框进行分类,不同的类别表示聚类中心,坐标为新先验框的宽高维度。

将获取的先验框分配给不同尺度的特征图,在最小的13×13式特征图上,需要使用的先验框为大尺寸:(302,109)(347,219)(380,364);
而在26×26特征图上,需要利用中尺寸先验框(158,77)(187,285)(278,330)进行对象检测工作;
在52×52特征图上,利用的是较小先验框(36,44)(62,144)(117,231)对较小对象进行检测。

此外,相关人员需要完成数据增强处理。此次研究适用mixup,每次随机抽取2个样本点,生成新的虚拟样本点。mixup是邻域风险较小的形式,可以与先验知识有效结合,生成的特征向量线性插值可以完成扩展训练分布。因此,只需要利用少量几行代码就能实施,几乎不存在计算开销。该增强方法可以以最先进的模型ImageNet、语音与表格数据集的泛化误差为基础进行改进。

3.2 标签平滑化

在开展多类别训练任务时,必须确定数据集的标签类别,假定正样本为1,负样本为0,可以获取一个one-hot向量:

式中,y代表目标真实类别;
i表示不同类别中的一类。

上述过程可能会导致模型对预测类别的依赖性增强,如果数据出现噪声问题,会影响训练结果的精确度。如果数据量分布不均衡,对某一类数量多的标签依赖性较强,可能会出现拟合现象。

在Inception v2提出了标签平滑化,将其作为正则化策略,在软化one-hot类型标签的过程中,需要计算损失值,并且要对过拟合现象进行有效抑制。

对标签进行更新处理后,其分布与在真实分布中加入噪声有一定的类似性,主要是为了方便计算。一般情况下,利用均匀分布能大大减少标签真实类别在计算过程中损失的权重,还可以增加其他类别在损失函数中的权重。在训练网络时,可以利用最小化预测概率以及真实概率的交叉熵,获取最优预测概率。在YOLOv3网络模型训练中必须加入抑制拟合现象,才能增强网络的泛化能力,对保证检测结果的精确度有积极作用[5]。

总而言之,此次研究在YOLOv3目标检测模型改进的过程中,必须对损失函数进行深入分析,可以利用多任务损失函数,通过垂直框和旋转框预测结果对目标方位角的估计偏差进行预测,提高SAR图像目标检测和方位角度估计精度。此外,完成模型改进后,需要保持较快的推理速度。通过验证实验可以确定,该改进模型在纯海洋背景下的目标检测工作中具有应用价值,并且目标方位角估计的准确度较高,对靠岸情况正常目标检测精度并不高,在之后的研究中需要从这一角度出发深入分析。

猜你喜欢 先验舰船类别 舰船通信中的噪声消除研究舰船科学技术(2022年21期)2022-12-12风浪干扰条件下舰船航向保持非线性控制系统舰船科学技术(2022年10期)2022-06-17基于暗通道先验的单幅图像去雾算法研究与实现客联(2021年9期)2021-11-07论陶瓷刻划花艺术类别与特征陶瓷学报(2021年4期)2021-10-14舰船测风传感器安装位置数值仿真舰船科学技术(2021年12期)2021-03-29先验想象力在范畴先验演绎中的定位研究海外文摘·艺术(2020年22期)2020-11-18一起去图书馆吧少儿画王(3-6岁)(2020年4期)2020-09-13一种考虑先验信息可靠性的新算法矿山测量(2020年2期)2020-05-17先验的风岁月(2016年5期)2016-08-13选相纸 打照片微型计算机(2009年4期)2009-12-23

推荐访问:孔径 舰船 合成