OAIS研究及对我国电子文件管理的启示_电子文件

  [摘要]运用文献调研、比较研究等方法,从功能模型、信息模型等方面分析国内外OAIS研究的现状,指出OAIS与电子文件全生命周期管理的目的是一致的,将OAIS引入到电子文件管理项目开发方法论中,拓展对OAIS功能模型、信息模型等内容的研究,进一步构建基于OAIS的可信电子文件管理项目框架体系,满足电子文件全生命周期管理的需要。
  [关键词]OAIS 电子文件管理 生命周期
  [分类号]G27
  电子文件管理系统(electronic record managementsystem,ERMS)是在政府机构内部使用的,包括技术、管理、法律、标准、人员等相关因素在内,以实现文件、档案的科学管理和高效利用为目的的信息系统。根据“我国电子文件管理国家战略的基础理论与框架体系研究”课题组的调查数据,可以看出绝大多数ERMS开发缺乏成熟通用的模型支持,因此存在功能不完善、开发不规范、维护不标准的问题,并不能算作真正意义上的ERMS。
  ERMS最重要的一个功能是对电子文件的长期保存,而在国际信息资源领域受到广泛关注的开放档案信息系统参考模型(The Reference Model for an OpenArchival Information System,简称OAIS)正是一项基于数字信息长期保存与获取的标准模型,其目的与电子文件全生命周期管理是基本一致的,应该可以成为电子文件管理实践的参考模型,实际上0MS完全可以成为电子文件管理实践的模型。由于0AIS专注于概念与术语,主要是一个概念模型,不完全是一个逻辑模型,直接用其来指导电子文件全生命周期管理的实践还具有一定的难度,需要对其进行拓展。本文通过对国外0AIS研究现状的分析评述,尽可能分析其对我国电子文件管理的启示。
  1 OAIS研究现状
  国内外关于OAIS的研究深入、全面,既有理论方面的论述,更多的是和实践结合的项目研究,许多研究是对OAIS的延伸。以下结合0AIS的核心内容,从几个方面进行总结。
  1.1 OAIS功能模型的实体扩展
  OAIS将其功能模型的6个功能实体分解为二级模块,对二级模块的功能也做了明确的说明,但对这些功能怎么实现、实现时与其他模块的功能交互与数据交换却没有进一步的说明,这也是一些研究者抱怨OAIS可操作性不强的主要原因。针对这一问题,一些学者开展了富有意义的研究。
  ERPANET(Electronic Resource Preservation andAccess Network)设计了摄取(Ingest)的工作流图,认为摄取策略的关键目标是流程的自动化,对于摄取的标准、方法论与技术、法律与政策、人员做了初步分析。Kevin Glick和Eliot Wilczek将OAIS参考模型摄取实体的功能具体化为两个部分:协商提交协议、转移与确认。然后将这两部分又分为87个步骤,对摄取实体工作流进行了详细描述。
  1.2 文件格式管理
  OAIS参考模型中文件生成者向OMS提交信息包,生成者需要和OMS协商好提交的形式和内容,文件的格式管理是一个很重要的内容。Grauer M J、How-ley L K、Kopena J B和Regli wC等人认为文件格式管理是OAIS参考模型中的一个基本内容,提出一种基于RDF的文件格式管理方法。Stephan Strodl、AnderasRauberd等人认为需进一步对保存规划实体进行细化,将保存规划与摄取实体的相关功能紧密结合起来,修改OAIS预定的文件保存格式,允许接收新的文件格式。
  1.3 信息模型与元数据
  国外数字资源长期保存项目的元数据格式一般都建立在严格的理论框架和细致的研究过程基础上,比较详细地定义了用于描述数字信息长期保护的元数据元素和子元素集合,这个理论框架最常见的就是OAIS,许多机构或学者提出的元数据方案与OAIS信息模型的组织方式一致,如CEDARS、中文元数据方案、NEDLIB等。即使有不完全一致的,也会声明参考了OAIS,并做到了与OAIS信息模型的完全映射,如NLA,没有明显采用OAIS模型,但表示从OAIS中得到启示,宣称其元数据可以准确向OAIS信息模型映射。
  1.4 OAIS模型的实现
  Helen Hockx―Yu认为,OAIS可用来对不同类型的数字存储系统进行规划和设计,但不是所有的OAIS设计功能都需要在一个单一存储系统中得到实现,即可以对OAIS模型进行分解,而不一定要把OAIS作为一个整体来实现。
  Jaqueline Spence提出了OAIS―SIMPLEX的观点,机构可以根据自己的可用资源与建设存档系统的动机(incentive)来决定实施OAIS的复杂性、OAIS角色的分配以及建立映射以遵循OAIS的层次。
  1.5 数字存储仓库(digital repository)的研究
  数字存储仓库是一切基于OAIS系统的核心。Perla Innocenti、Andrew Mchugh、Seamus Ross与RaivoRuusalepp等人提出了数字存储仓库的10个特征:维护数据对象;组织适应性;法律和制度;有效的政策;收集和摄取标准;完整性、真实性和可用性;起源;分发;保存规划与行动;适当的技术基础设施。他们进一步分析了信息数字仓库应具有识别风险与优先考虑风险、减少风险发生的可能性、建立有效的应急机制以减轻发生风险影响的能力。
  1.6 其他相关问题研究
  OAIS参考模型的主旨就是为了数字信息的长期保存,涉及到多个学科,内容广泛。许多学者从不同角度对其进行了研究。
  Paul Wheatley在OAIS框架下从成本核算的角度对数字保护的生命周期进行研究;LaPlant Lisa、Zwaard Kate等人对基于OMS的系统进行了信息内容真实性与完整性的研究;Nancy MeGovern从组织、技术、协作等方面对基础设施与OAIS的一致性进行了研究;Dirk Roorda研究了OAIS框架下如何将电子文件迁移到XML格式。
  2 OAIS研究评述
  2.1 起步较晚,发展迅速;成果很多,问题不少
  国际上,学界对OAIS的研究起步比较晚――从1995年NASA的CCSDS推出0AIS算起,不过只有十几年的时间。而国内对于OAIS的研究更晚,最早能查到的公开发表的论文是图书情报学界张晓林教授2001年发表的关于数字信息长期保存问题的文章,而国内档案界最早研究OAIS的文章则发表于2007年。
  国外对OAIS的研究较多,既有相关组织对OAIS的系统解读,对OAIS功能模块、信息模块的扩展研究,也有学者对OAIS相关内容的深入研究,取得了较为丰硕的成果,一些基于OAIS的系统、元数据方案陆续出 现。国内最初对OAIS是引进介绍、全面解读。近一两年,对OAIS的研究开始深入、具体,出现了一些论文和基于OAIS的系统,如李春旺与张晓林关于可信工作流的研究、中国科学院档案馆系统、国家图书馆的数字保存系统等。
  但问题依然存在。从国外看,对OAIS的研究存在很大的拓展空间,如OMS功能模块各功能实体以及模块可操作性的延伸、OAIS对于电子文件凭证价值的作用与实现、可信的基于OAIS的系统框架等。国内对OAIS的研究更多还是在研读阶段、不够深入,研究成果可操作性不强,难以直接对实际工作进行直接指导。电子文件管理项目没有通用功能需求,没有通用的功能模型,受软件开发商主导因素影响太大,一些号称是基于OAIS的电子文件项目仅仅套用了OAIS参考模型的外形,并没有实现OAIS的功能,电子文件管理系统的开发还是沿用普通的软件开发模式。这种软件生产商主导的模式,限于其对档案与电子文件前沿理论的理解,其模型构建必然局限于现有工作的实际,映射出的实际系统也必然是现实档案工作的反映。OAIS模型必须有更深入的研究与扩展,才会有较强的对实践的指导意义。
  2.2 研究重心向实证倾斜
  近年来,学界对OAIS的应用展开了相应的研究。一些学者提出了基于OAIS的系统建设框架、基于OAIS信息模型的元数据方案,尽管某些研究离OAIS的功能还有一定差距,但这些探索是有益的,为将来基于OAIS的电子文件管理项目开发奠定了基础。
  对于电子文件管理的研究也是如此。电子文件管理是一个全生命周期管理的过程,其基础理论研究是上世纪电子文件管理研究的主流方向。2000年以来,电子文件管理基础理论基本明确,研究重点迅速向实际问题倾斜。冯惠玲教授在电子文件管理国家战略中提出的“国家数字档案馆计划”是研究向实证倾斜最有力的一个例证。
  2.3 研究呈多学科发展趋势
  多学科发展是指研究领域多学科交叉、渗透、互联。OAIS的研究呈现多学科发展的趋势,通过论文前述的内容可以看出,0AIS研究者有档案学者、信息管理学者、计算机专家、经济学家、管理学家等。
  电子文件管理也是一个涉及到档案学、计算机科学、信息管理学、公共管理学、经济学、法学、行政管理学等领域的跨学科的研究领域。“国家数字档案馆计划”要从管理体制、制度、技术、方法等方面为全国电子文件管理体系奠定基础,必然需要不同学科学者的共同努力。不同学科对OAIS的研究必将促进国家数字档案馆的建设。
  2.4 研究力量的多元化
  在国外,有不同性质的研究机构包括国际性组织和非政府的民间组织,积极参与电子文件管理与OAIS的研究工作,取得了丰硕的研究成果。InterPARES就是一个众多国际专家参与的国际性项目,前两期成果集成了各国许多优秀实验基地的经验,制定出一系列电子文件管理的原则、方法、指南、模板、功能需求等,这些成果在全球产生了广泛的影响,成为美国ERA等许多项目研发的重要基础和指南。
  3 对我国电子文件管理的启示
  3.1 加大对电子文件管理项目开发与设计的方法论研究
  传统信息系统的开发遵循从现实手工系统的工作流着手,通过实际工作业务调研、向工作人员询问等方法,描绘出其业务流程,通过对业务流程的抽象建立其逻辑模型,再用软件工程的方法将逻辑模型转化为物理模型,最后经过编程与试运行,新的信息系统开发就算成功了。这个过程的前提是现实系统(手工系统或计算机系统)的工作流比较清晰,工作人员对业务需求比较明确。实际上现有的档案管理软件正是这样一个开发过程。
  但这样的开发过程对于我国电子文件管理系统并不完全适用,原因就是档案管理人员对于电子文件管理业务的需求不清晰,尤其是基层的档案工作人员由于计算机与电子文件管理知识结构的不合理使其无法提出相关的功能需求,而我国电子文件管理系统通用功能需求规范尚未出台,这种情况下开发出的电子文件管理项目必然会有很大的盲目性与功能的欠缺。
  因此,我国的电子文件管理项目的实施必须要有方法论做指导,目前我国这方面的研究基本为空白。基于此,从电子文件管理系统的建模出发,引入OAIS,致力于构建一套适合我国电子文件管理系统实施的方法论,是十分必要的。
  3.2 拓展对OAIS的研究
  2002年OAIS成为ISO国际标准以来,许多专家从各自的角度对OAIS进行拓展,使其更加具有可操作性。笔者于2011年6月对中国期刊全文数据库以OAIS为主题进行检索,得到学术文献79篇,以OAIS为篇名进行检索,得到文献39篇。在检索得到的研究文献中,真正对OAIS参考模型进行拓展研究的不过数篇。
  从国外的研究看,一些基于OAIS的研究或项目都是在OAIS的框架内或对其6个功能实体进行细分,或对其元数据模型进行具体化。国内相关研究很少,尤其是OAIS功能模型的6个功能实体的细分几乎没有,这在很大程度上限制了OAIS参考模型的实际应用。
  考虑到国内外电子文件管理体制、方法等的不同,应在对国外相关研究梳理的基础上,尝试根据我国电子文件管理的实际对OAIS参考模型进行拓展,对OAIS功能模型各个实体的子功能再进行细分,直到分解到不可再分的操作为止,尤其是对起关键作用的摄取(ingest)实体(即“收集”)进行细分,使其成为一个适合我国电子文件管理实践的真正的逻辑模型。对于OAIS的信息模型也需要实例化,细化出电子文件的元数据模型。这将对我国电子文件管理项目的实践起到指导作用,对于我国电子文件管理通用功能需求也有一定的参考价值。
  3.3 构建基于OAIS的可信电子文件管理项目框架体系
  电子文件管理项目虽然在我国出现了数量上的井喷,但很多是低水平的重复,一个很重要的原因是既没有通用的电子文件管理系统功能需求规范,也没有一个可以作为示范甚至借鉴的电子文件管理项目。
  电子文件管理系统建设是一项复杂的系统工程,是由一系列相互关联、相互作用的各种因素的集合。基于电子文件生命周期和OAIS参考模型,构建一个基于OAIS的可信电子文件管理项目框架体系,重点关注综合档案馆电子文件管理系统的开发,通过软件系统的开发来实现其规范化要求,从标准体系、制度、技术、方法等方面为综合档案馆电子文件管理提供一个可操作的解决方案。该框架体系应该包含可信电子文件库、可信电子文件管理流程、通用公共服务、标准等。
  可信的电子文件库是一个能在现在和将来对其所保存的电子文件向用户提供可靠的、长期访问的文件存储库,类似于国外数字存储仓库,是ERMS的数据存储基础设施;可信的电子文件管理流程是电子文件长期保存的保证,可信流程是对原有管理流程的优化与重组,删除错误的流程、改进低效的流程、增加缺失的流程,它和可信的电子文件库一起组成了ERMS的物理核心,实现系统的功能,通过流程重组建立可信的流程,实现电子文件的长期保存与提供利用;通用公共服务提供一系列功能和机制为系统生成可信的环境,同时提供多种工具识别,增强电子文件的真实性、完整性与可读性;标准和政策是系统设计与实施的依据。
  参考文献:
  [1]张宁.我国电子文件管理现状调查与思考[J].档案学通讯,2008(6):15-19
  [2]李泽锋.电子文件管理项目建设方法论研究[J].档案学通讯,2009(4):16-19

推荐访问:对我 文件管理 启示 国电