面向联合试验的管控工具设计与实现

卢赟浩,李 宁

(华北计算技术研究所,北京 100083)

现代信息化战争中战场形势瞬息万变,在信息化的条件下,武器装备体系的建设迫切需要适应一体化联合作战的要求,所以开展联合试验成为建设武器装备体系的重要过程之一[1]。联合试验是把不同地点、不同类型的试验作战资源集成为一个试验系统,支持大规模作战试验或复杂武器装备试验的一种试验模式[2]。联合试验的开展需要跨兵种、跨部门进行,通过接入各类参试节点,利用各种异构仿真系统、计算机软硬件等资源,来建立公共的联合试验环境[3]。为保证联合试验顺利开展与运行,需要试验管控工具对参试节点进行有效的管控,为试验开展提供全过程支撑,保证试验系统高可靠运行。

国外用于联合试验的管控工具大多是基于高级体系结构(High Level Architecture,HLA)和试验与训练使能体系结构(TENA)[4-6],其对于HLA与TENA架构的节点具有较好的兼容性,但对于异构节点管控效果不是很好。

国内相关科研院校对管控工具的研究是基于联合试验平台(H-JTP)[6-7],实现了对试验全生命周期的运行控制,并开发了相关可视化平台[8],实现了远程观察整个联合试验态势,但对多节点、多维度的状态监视仍存在不足,对于单个节点未进行合理管控,其通过脚本对节点进行接入,无法进行参试节点的动态扩展。

针对上述需求和问题,本文设计一种面向联合试验的管控工具,其中包括三个模块:试验环境开设、试验状态监视、试验执行控制,实现参试节点的动态接入与注册;
在试验过程中对节点的运行情况和试验情况监视,并通过活动协调命令对参试节点进行执行控制。

试验管控工具作为联合试验系统中的组件之一,是试验开展的门户和助手[9],直接面向试验管控人员,为其提供试验环境开设、试验状态监控、试验执行控制功能,可进行试验全过程、全要素的管控服务。试验管控工具可以在复杂的多节点试验环境下兼容各类参试节点,依托节点注册服务完成节点的注册与接入,生成节点逻辑环境视图。

在试验过程中,管控工具进行试验状态监视,通过心跳检测服务检测节点存活状态,解析参试节点响应管控工具的心跳报文,获取节点的运行状况和试验情况,当参试节点掉线和性能告警时,能够及时发现并上报。同时,在试验中管控工具能够干预控制参试节点的试验活动,生成执行控制命令,依托活动协调服务下发命令,完成对节点的试验过程控制和试验执行管理。本文根据管控工具的功能定位,采取软件分层架构模式对管控工具的架构进行设计,如图1所示,将管控工具分为三层:数据层、业务逻辑层、应用表示层。

图1 试验管控工具系统架构图

1)数据层为试验管控工具提供数据支持以及运行状态日志存储功能,主要包括试验资源库、试验方案库和日志库等。

2)业务逻辑层为应用表示层所提供的各项功能提供服务支持,主要包括节点注册管理服务、心跳检测服务、活动协调服务和数据统一访问服务。节点注册服务提供节点信息注册更新、逻辑与物理∕虚拟节点映射管理;
心跳检测服务动态设定心跳报文的发送间隔,对参试节点进行动态心跳检测,获取参试节点状态;
活动协调服务生成活动协调命令,对试验活动进行协调;
数据统一访问服务为试验资源库、试验方案库、日志库等数据提供统一的访问接口。

3)应用表示层为试验人员提供试验环境开设、试验状态监控、试验执行控制、试验资源管理等功能,便于进行试验管控。

联合试验的开展需要接入多个参试节点,本文依托管控工具的试验环境开设模块进行自动开设试验任务环境,其中包括参试节点注册、参试节点基础环境获取、节点逻辑视图生成。该模块首先通过节点运行软硬件支撑平台动态发现参试节点;
然后获取节点的基本信息,进行节点信息比对,判断该节点是否注册,未注册的节点进行注册信息更新和注册信息上报,已注册的节点在节点信息比对后,进行节点信息更新和注册信息更新;
最后生成节点逻辑视图。试验环境开设结构如图2所示。

图2 试验环境开设结构图

2.1 节点注册状态机

为保证节点注册的可靠性,根据参试节点注册流程设计如图3所示的节点注册状态机,包括注册中、注册完成、注册失败三个状态。首先,参试节点获取该节点的注册信息,并向中心节点注册,如果连续3次注册失败,则判定为节点不可达,注册失败;
如果注册成功,则启动定时器,每间隔固定时间触发定时器,发送或更新注册信息。

图3 节点注册状态机

2.2 节点注册内容

节点注册内容包括节点标识、节点类型、节点的基本配置信息、节点安装的网卡及对应的IP地址、节点已部署的试验资源信息、节点已安装参试资源的模型配置信息,详细信息如表1所示。

表1 节点注册内容详细信息

联合试验中参试节点环境复杂,试验状态不一,实现对参试节点的试验状态监视对于整个试验过程至关重要[10]。为了实现这个功能,本文设计一种试验状态监视模块,依托心跳检测服务,管控工具周期性地向参试节点发送心跳报文,并监听参试节点返回的心跳报文,来监视参试节点的试验状态。

3.1 心跳检测原理

心跳检测是通过系统中的心跳检测器监督各节点发送的心跳信息来判断节点是否发生故障,是分布式系统中常用的故障检测方法[11-12]。心跳检测有两种方式:Push方式和Pull方式,如图4所示。在Push模式下的心跳检测,被检测节点周期性地主动向心跳检测器发送心跳报文,如果心跳检测器在指定时间内未收到节点发来的心跳报文,则认为被检测节点发生故障,已经失效。在Pull模式下的心跳检测,心跳检测器向被检测节点发送心跳报文,被检测节点收到心跳报文后响应心跳检测器,返回相关心跳报文。如果心跳检测器发送心跳信息后未收到被检测节点的响应,则认为该节点发生故障,已经失效。

图4 Push方式和Pull方式

从图4可以看出,Push式心跳检测可以减少系统中心跳报文的数量,在相同检测周期的情况下,Pull式心跳报文是Push式的2倍。虽然Push式的消息负载比Pull式小,但是心跳检测器和被检测节点的关系在系统初始化的时候就指定了,整个系统的故障检测拓扑结构无法改变,非常不灵活。而Pull式属于主动检测,心跳检测器可以根据参试节点逻辑变化来改变检测结构,在联合试验环境下具有更强的实用性,在联合试验分布式系统中,相对于2倍的心跳报文负载,系统的动态心跳检测比较重要。

借鉴DEMA-FD心跳检测模型[13],管控工具的心跳检测服务采用的是Pull式心跳检测,考虑到本文管控工具的试验状态监视功能,所采用的心跳检测不同于传统的心跳检测方法,不仅需要检测节点是否存活,还需要通过被检测节点响应的心跳报文完成对节点试验状态的监视,因此需要对心跳报文信息进行设计。

3.2 心跳报文信息内容

试验管控工具依托心跳检测服务将心跳报文发送至被管控节点,通过节点返回的心跳报文来实现对节点的状态监视。试验状态监控的内容主要包括节点运行状态、节点试验情况、异常告警信息,其中通过被管控节点返回的心跳报文信息获取节点运行状态和节点试验情况,当节点运行状态中的关键指标达到规定的阈值时,管控工具会报告该节点的异常告警。

考虑到管控工具需要通过被管控节点返回的心跳报文信息获取节点运行状态和节点试验情况,设计节点返回的心跳报文内容,如表2所示。

表2 心跳报文详细信息

试验管控工具接收试验人员指令后,通过活动协调服务生成活动协调命令并下发至参试节点,参试节点接收命令后对相关的仿真软件进行活动协调,从而实现对联合试验的执行进行预控制。试验执行控制流程如图5所示。

图5 试验执行控制流程

参试节点收到活动协调命令后,基于试验基础服务平台提供的活动协调服务完成对命令的解析,并对相关软件进行协调。本文根据联合试验执行控制的需求,设计如表3所示的试验活动协调命令分类,主要分为试验过程控制命令、试验执行管理命令两种类型。

表3 活动协调命令详细内容

为了验证试验管控工具对联合试验的管控的正确性和有效性,利用联合试验任务环境构建软件支撑平台,以我军某导弹陆海飞行性能试验为背景,验证本工具能否对整个试验过程进行有效地管控。

在此次试验任务中,共有20个参试节点,本文管控工具在试验环境开设时需要对20个参试节点进行节点注册,生成相关逻辑视图,并在试验运行过程中对节点进行状态监视与执行控制。

首先,利用节点注册服务对20个参试节点进行注册,获取节点的基本环境,完成对参试节点的接入,并生成节点逻辑视图,展示节点的基本信息(节点绑定情况等)。由图6所示的环境开设节点逻辑视图可以看出,管控工具对20个节点均完成节点注册与接入,生成相关节点逻辑视图。

图6 环境开设节点逻辑视图

在完成试验环境开设后,开始试验。在试验过程中,管控工具进行试验状态监视,监视每个节点的CPU占用率、内存使用量,并以饼状图展示,如图7所示。

图7 节点试验状态监视图

在试验过程的某个时间的20个节点中,CPU占用率在0~10%的节点有12个,在10%~30%的节点有3个,在30%~50%的节点有5个,在50%~100%的节点0个;
内存使用量小于1 GB的节点有2个,在1~3 GB的节点有8个,在3~5 GB的节点有5个,大于5 GB的节点有5个。

在本文试验中,将CPU占用率性能告警阈值设置为60%,将内存使用率性能告警阈值设置为80%,当参试节点的CPU利用率大于60%或内存使用率大于80%时,管控工具会监测到该节点的告警信息并上报。节点CPU、内存监视图如图8所示。

图8 节点CPU、内存监视图

当该节点的CPU占用率达到67%时,进行性能告警,该节点内存大小为8 GB,内存使用未到达阈值,所以未进行内存告警。

试验过程中,管控工具对参试节点进行执行控制,并下发表3所示的6种活动协调命令,每种命令下发20次,共120次,统计参试节点成功收到命令并进行相关活动的协调次数,测试管控工具活动协调成功率。参试节点活动协调情况如图9所示,活动协调成功率为98.3%。

图9 参试节点活动协调情况

本文设计一种面向联合试验的管控工具,该工具支持对多个参试节点的试验管控,通过节点注册服务实现参试节点的动态注册与接入;
还可以通过开设试验环境,生成相关的节点逻辑视图。为在试验过程中对参试节点进行状态监视,设计一种基于心跳检测机制的试验状态监视模块,实现监视参试节点的运行状态和试验情况,能够及时发现并上报节点的性能告警。管控工具通过活动协调服务下发协调命令至参试节点,实现对节点试验活动的执行控制。

经测试,本文工具能够完成对20个参试节点的注册与接入,可对节点运行时的CPU、内存使用等进行状态监视,并进行相关的性能告警,能成功下发活动协调命令至参试节点,执行控制成功率为98.3%,满足各项设计要求。测试结果表明,所设计工具能够实现对参试节点高有效管控,达到了联合试验的管控标准。

猜你喜欢视图报文工具基于J1939 协议多包报文的时序研究及应用汽车电器(2022年9期)2022-11-07波比的工具小太阳画报(2020年11期)2020-12-10波比的工具小太阳画报(2020年10期)2020-10-30CTCS-2级报文数据管理需求分析和实现铁道通信信号(2020年4期)2020-09-21浅析反驳类报文要点中国外汇(2019年11期)2019-08-27准备工具:步骤:红领巾·成长(2018年10期)2018-11-195.3 视图与投影中学生数理化·中考版(2017年6期)2017-11-09视图非公有制企业党建(2017年10期)2017-11-03“巧用”工具读者(2017年18期)2017-08-29Y—20重型运输机多视图现代兵器(2017年4期)2017-06-02

推荐访问:面向 试验 联合