钳表在测量的状态下【一种基于动态反馈的三级网状态测量机制】

  摘要:随着三级网发展为集数据、语音、视频于一体的综合信息网,只对某个或某几个性能参数的测量已经不能满足分析复杂的网络状态及其产生原因的需要。该文提出了一种基于动态反馈的三级网状态测量机制。该机制通过守护测量获取网络的基本状态,然后根据获取的测量结果判定是否需要对网络状态进行进一步的测量,若需要,则自动选择待测参数和测量手段,发起反馈测量,获取进一步的网络状态信息以分析现有状态出现的原因。该测量机制能够反映网络故障等产生的深层次原因,有利于及时准确的故障设备,保证网络的正常运行。
  关键词:动态反馈;三级网;状态测量;守护测量;反馈测量
  中图分类号:TP393文献标识码:A文章编号:1009-3044(2012)03-0707-04
  A Dynamic Feedback Measurement Mechanism for Three-layer Network
  GAO Wei,XIAO Xiao-qiang, HE Jing
  (Computer School, National University of Defense Technology,Changsha 410073,China)
  Abstract:With the development that the three-layer network has become a comprehensive network including the data, audio and video service, the sample measurement focusing on one parameter or several ones can not fulfill the need of analyzing the complex network situa? tion. A Dynamic Feedback Measurement Mechanism for Three-layer Network (DFMM-TN) is proposed in this paper. In this mechanism the Daemon measurements get the basic state of the network. And depending on the basic information whether one or several feedback measurements are needed is decided. If needed, the parameters which should be measured and the measurement tools should be chosen au? tomatically. The feedback measurements will get more information to analysis the network state and its origin. This mechanism can reflect the roots of network failure and so on. And it can help to orientation the failure devices and maintain the network in normal state.
  Key words: dynamic feedback; three-layer network; situation measurement; daemon measurement; feedback measurement
  本文所述的三级网指政府、企业和校园等建立的大型局域网,这些网络具有典型的三层分级拓扑结构,分为核心层、汇聚层和接入层三个层次。由于三级网具有拓扑结构层次明显、运行业务种类可控、接入用户身份单一等特点,对其进行状态监测相较广域网运行状态监测容易实现。但是,目前三级网已经由传统的数据传输网络发展为集数据、音视频等于一体的综合信息网。与此相适应,三级网上运行的网络业务也由ftp、电子邮件等传统业务为主,发展为以音视频会议、远程教育、实时多媒体等新型业务与传统业务共存,这就使得对其状态进行有效监控,及时发现和处理网络故障越来越困难。
  目前,ITU-T的SG13工作组[1-2]和IETF的IPPM WG[3-6](IP performance metric working group)分别对网络测量的性能参数进行了定义,主要包括:1)连接性;2)单向延迟和丢包率;3)双向延迟和丢包率;4)延迟抖动;5)报文重排序;6)传输容量;7)带宽容量。同时,对这些参数的测量方法进行了定义。
  现有的网络状态测量方法总体上可分为主动测量和被动测量两类。主动测量是在选定的测量点上利用测量工具有目的地主动产生测量数据包,注入网络,并根据测量数据包的传送情况来分析网络的性能,如ping,traceroute等。被动测量是指在链路或设备,如路由器,交换机等上安装数据采集器或在某些主机上运行定制的协议栈对网络进行监测,如SNMP和IPMON[7]等。
  现有的网络状态测量方法往往只是简单的监控某个网络性能指标,这就导致在发生网络故障时,不能及时发现网络故障的根本原因并加以排除。例如,利用ping工具可以发现从主机A到主机B链路不通,但是导致这一故障发生的原因却可能有多种,如主机B故障或从A到B的链路中任意一个交换设备故障等。甚至有可能主机A到主机B链路正常,只是链路中的某个节点屏蔽了IC? MP报文等。
   1 DFM-TN机制的逻辑结构和运行流程
  DFM-TN机制并不涉及针对某个网络性能参数的新测量方法或原有测量方法的改进,该机制的贡献在于提出了一种新的检测机制:周期性的发起与当前网络状态无关的主动测量和被动测量,获取网络的基本状态,我们称这类周期性的测量为守护测量。针对守护测量发现某种网络故障,自动选取和组织现有的网络性能测量工具,发起反馈测量,获取分析解决该故障所需的性能参数, 然后整合处理获取的测量数据,进而对故障做出分析和判断。
  需要说明的是,守护测量和反馈测量所使用的测量手段并没有严格的区分,某种测量手段既可以作为守护测量出现,也可以作为反馈测量出现。但是,作为周期性发起的测量,一般选取运行时间短,资源开销小,获取信息准的测量手段作为守护测量的手段。与之相反,作为反馈测量出现的测量手段,往往需要获取较为复杂的网络信息,其时间和资源开销往往比较大。
  1.1 DFM-TN机制的逻辑结构
  如图1所示。该机制主要由调度模块、测量规则集及其配置接口、测量数据集及其交互接口和测量工具集及其配置接口组成。下面逐一对该机制组成模块的功能进行介绍。
  
  图1 DFM-TN机制的逻辑结构图
  调度模块:1)维护该机制包含的守护测量,获取当前网络状态;2)根据守护测量获取的数据,决定是否启动和启动何种反馈测量。例如,每间隔N秒钟,调度模块发起一次对主机A和主机B之间丢包率的监测,然后根据设定的丢包率阈值,判定是否启动反馈测量,寻找导致丢包率超限的原因。
  测量规则集及其配置接口:1)存储和配置守护测量规则,如以多大的间隔发起某种守护测量等;2)存储和配置特定网络状态与应触发检测的反馈测量映射规则,该映射规则为多对多映射,即多种网络状态可能触发同一种网络性能参数检测,一种网络状态也可能触发多种网络性能参数检测。主机不可达和DNS无响应都可以触发traceroute工具,DNS无响应可以触发ping、traceroute和丢包率检测等多种工具。
  测量工具集及其配置接口:1)存储和配置现有的多种网络性能参数测量工具,如ping等。2)为多种现有的网络性能参数测量工具和调度模块提供统一的交互接口,即将测量工具提供的不同格式的测量结果,如ICMP报文、结果文件、自定义数据结构等,转变为调度模块可识别的统一数据格式。由此,我们可以容易的将新出现的测量工具加入到该机制的测量工具集中,保持机制的有效性和灵活性。
  测量数据集其交互接口:1)存储检测数据2)向调度模块提供当前网络状态3)以报表、图表等形式向管理员报告检测结果。
  1.2 DFM-TN机制的运行流程
  DFM-TN机制的运行流程可概要的分为初始化、正常运行和配置维护,具体流程如图2所示。该运行流程的关键在于,测试结果集维持了被检测网络的状态,测量规则集规定了各网络状态会触发的检测,调度模块根据网络状态的变更和测量规则集的规定,完成被检测网络状态的更新。
  
  图2DFM-TN机制的运行流程图
  图3给出了一个由调度模块发起主动测量从而引发反馈测量的DFM-TN机制运行示例。根据计时器给出的时间信号,调度模块按照固定的时间间隔发起Ping操作。根据Ping获取的检测数据和规则集中的映射规则,调度模块采取不同的反馈操作:若获取的网络延迟大于阈值T,COMPACT[8]测量工具将被调度,以进一步确认网络延迟;若丢包率大于阈值N,PATHNECK[9]测量工具将被调度,以确定链路的瓶颈节点。当然,若网络延迟大于阈值T丢包率大于阈值N两个条件都满足,调度模块会顺序调度两个测试工具,并根据COMPACT和PATHNECK的检测结果,判断是否进行更进一步的反馈检测。
  
  图3主动测量引发反馈测量示例图
  图4给出一个由调度模块维持的被动测量引发反馈测量的DFM-TN机制运行示例。计时器记录从主机A上一次收到从主机B发出的报文起所经过的时间t。若在t超过规则集中设定的阈值T前收到了来自主机B的某个报文,计时器清零;若发现t超过了阈值T,则发起反馈操作Ping,以确定从主机A到主机B的链路有效性。当然,还可以在规则集中设定根据Ping的结果而采取不同的下一步操作的规则。
  
  图4被动测量引反馈测量示例图
   2 DFM-TN机制的示例实现及测试数据
  为验证机制的有效性,我们对图4所示的DFM-TN机制运行流程进行了扩展和实现,进行实现的网络拓扑如图5所示,主机A通过汇聚交换机S连接到核心路由器R,主机B通过汇聚交换机S’连接到核心路由器R。在主机A上运行DFM-TN机制的实现程序,主机B上运行一个发包程序,每隔n秒(n小于主机A上实现的DFM-TN机制的规则集中设定的阈值N)向主机A发送一个内容为Test的IP包。具体的实现细节为:
  1)计时器记录从主机A上一次收到从主机B发出的报文起所经过的时间t;
  2)在t超过规则集中设定的阈值T前收到了来自主机B的某个报文,计时器清零;
  3)若发现t超过了阈值T,则发起反馈操作Ping,以确定从主机A到主机B的链路有效性;
  4)若主机A到主机B链路有效,计时器清零,转到1)
  5)若主机A到主机B链路失效,则运行traceroute,依次检测从主机A到主机B的链路所经节点;
  6)根据traceroute返回的结果和其他可获取的信息,如路由器R的配置信息,确定故障节点;
  
  图5DFM-TN机制运行示例实现网络拓扑
  实验共分两部分进行:
  a)暂停主机B上的发包程序;
  b)断掉交换机S’的电源,即造成S’故障。
  a)的实验结果如图6所示,暂停主机B上的发包程序N秒后(N取10秒),主机A主动发起了对主机B的Ping操作,报告其主机A到B的链路正常;
  
  图6 a)实验结果
  b)的实验结果如图7所示,人为造成S’故障N秒后(N取10秒),主机主机A主动发起了对主机B的Ping操作,而后发起tracer? oute操作,根据traceroute操作返回的数据和路由器R的配置信息,报告故障节点为S’.
  
  图7 b)实验结果
   3总结及下一步的工作
  根据网络状态监测不应单单监测某一或某几个性能参数,而更应该关于引发网络状态异常的深层次原因的观点,本文提出了基于动态反馈的网络状态测量机制DFM-TN,其调度模块根据设置合理有效的测量规则集加载守护测量工具和反馈测量工具,可迅速有效的发现网络状态异常的根本原因,从而为理解和解决网络状态异常提供依据。但是,本文只是初步的提出了DFM-TN的框架和实现了其运行流程的简单样例,距离其可以真正投入使用,还有获取现有监测工具、整合监测工具接口、设定完备的规则集等一系列复杂而艰巨的任务需要完成。
  参考文献:
  [1] ITU-T Rec.Y.1540.IP Packet Transfer and Availability Performance Parameters[Z].2002.
  [2] ITU-T Rec.Y.1541.Network Performance Objectives for IP-Based Services[Z].2002.
  [3] IETF,RFC2679.A one-way Delay Metric for IPPM[Z].
  [4] IETF,RFC268 1.A Round trip Delay Metric for IPPM[Z].
  [5] IETF,I江C3393.IP packet Delay Variation Metric for IPPM[Z].
  [6] IETF,RFC2680.A one-way packet lose Metric for IPPM[Z].
  [7] Overview of IPMON tracing[EB/OL].http://publib.boulder.省略/infocenter/hodhelp/v9r0/ index.jsp?topic=% 2Fcom.ibm.hod9.doc% 2Fdoc%2Ftroubleshoot%2Fipmonitor.html.
  [8] Ishibashi K,Kanazawa T,Aida M. Active / Passive combination-type performance measurement method using change-of-measure frame? work [J]. Computer Communications,2004,E87-B(1): 132 - 141.
  [9] Pathneck[EB/OL]. http://www.cs.cmu.edu/~hnn/pathneck/.

推荐访问:网状 测量 反馈 机制