数字资源整合的发展趋势 数字资源整合的主要目的是什么

发布时间:2020-03-07 来源: 感恩亲情 点击:

  〔摘要〕阐述并分析数字资源整合领域的理论、应用与技术方面的主要发展趋势。数字资源整合理论研究趋势主要表现为构建理论框架体系和研究重大的理论观点;资源整合范围与规模的不断扩大、在信息整合的基础上进行资源的知识整合以及融入语义网和知识网格,将是数字资源整合主要应用发展趋势;网格、SOA、P2P、Web服务等新型技术将对数字资源整合的未来产生重大影响。
  〔关键词〕数字资源整合 知识整合 语义网 知识网格 整合技术
  〔分类号〕G250.76 TP39
  
  Development Trends of Digital Information Resource Integration
  Ma Wenfeng Du Xiaoyong
  School of Information Resource Management, Renmin University of China, Beijing 100872
  〔Abstract〕This paper analyses the researches and development trends of digital information resource integration in the aspects of theory, application and technology. The paper thinks that the theoretical aspects include constructing a theoretical research framework and proposing some fundamental viewpoints, and that in application aspect, the scope and scale of the digital information resource integration will be extended extremely with the mainly application development trend that knowledge integration will become main stream on the base of data and information integration, and be melted deeply with the semantic web and the knowledge grid. Further, the paper points out that any advance in new technology supporting digital information resource integration, such as grid computing, SOA, P2P and Web service, will make important effects on the research and development of digital information resource integration.
  〔Keywords〕digital information resource integration knowledge integration semantic web knowledge grid integration technology
  
  1引言
  
  随着语义网、知识网格大环境的逐步形成,数字资源整合支撑技术的日渐完善,数字资源整合领域正在悄然并迅速发生着变化。可以这么说,理论、应用、技术,已成为我国数字资源整合领域重要的话题和发展脉络。本文循着这一发展逻辑,以近年国内外研究成果为基础,从理论与实践相结合的层面,探究并分析我国数字资源整合领域的理论研究、应用研究与技术研究方面的主要发展趋势。这三方面是互有关联,相互渗透的。为了便于说明,分别阐述。
  
  2理论研究趋势
  
  2.1理论框架研究
  2.1.1数字资源整合理论体系构建研究的必要性首先,从数字资源整合的可持续发展来看,需要理论体系的构建和研究。近些年来,国内相关学科领域对数字资源整合的研究比较活跃,但整体而言,理论研究相对滞后于实践的发展,至今没有形成公认的核心概念和完整的理论体系。尽管各领域的数字资源整合实践呈现出良好的发展态势,但缺乏科学理论体系的支撑,将对整合的可持续发展起制约作用。其次,从数字资源整合实践面临的问题来看,需要理论体系的说明与指导。数字资源整合是信息资源管理发展中出现的一种新的信息资源管理形态,在其具体的实践中不可避免地会遇到诸多问题,也常常带有不同程度的盲目性,因而需要一套系统的、完整的并可应用于数字资源整合实践的理论框架,以对实践中的问题作出科学的解释,并引导实践顺应科学的态势和走向。
  2.1.2数字资源整合理论体系结构研究数字资源整合的理论体系,是指一套由前后一致的关于数字资源整合的性质、特点、目标、对象、概念、原则、结构、功能、模式、技术等所组成的概念框架,以用于解释、评价、指导数字资源整合的实践。数字资源整合的理论体系可以由以下十个地位和作用各不相同的部分组成,它们之间相互渗透、相互作用,从而形成数字资源整合的理论框架:①数字资源整合的基础(理论和方法基础);②数字资源整合的目标;③数字资源整合的对象;④数字资源整合的概念;⑤数字资源整合的特征;⑥数字资源整合的功能;⑦数字资源整合的原则;⑧数字资源整合的方式(模式);⑨数字资源整合的技术;⑩数字资源整合的环境。上述十要素,国内相关学科领域都进行了不同程度的研究,但尚未上升到整体性、系统性的研究。数字资源整合理论体系的构建是一个复杂的系统工程,也是一个长期的过程。
  2.2新论题研究
  2.2.1关于知识组织将知识的控制单位从文献深化到文献中的知识元,实现知识元的链接,这是知识管理上的一场革命[1]。目前,在知识发现、知识获取、知识表示、知识展现、知识推理等知识组织处理技术的变革与创新的趋势下,知识组织的理论与方法也面临着变革与创新。要对知识组织的概念、目标、原则、特征、方法、功能等基本理论问题进行反思,进行基于信息组织但又超脱于信息组织的深入研究。目前,国内学者已经开始关注这一问题,如文献[2]探讨了在语义Web技术的驱动下,知识组织从物理层次的文献单元上升到认知层次的知识单元时,在理论和实践上发生的重大变化。
  2.2.2关于知识组织体系知识组织体系是伴随着知识组织体系研究的深入而出现的一个新研究课题,知识组织理论与方法的创新也必然对知识组织体系的研究产生重大影响,需要拓展与深化知识组织体系的理论及相关方面的研究。研究重点主要包括:研究知识组织体系概念的内涵和外延,对其进行符合知识组织理论精髓的界定;与信息组织体系相比,知识组织体系在性质和功能上所具有的本质特征;研究知识组织体系的结构、功能及其构建机制等。文献[3]探讨了对知识组织体系发展产生重大影响的理念和技术,提出了知识组织体系的构建模式。
  2.2.3关于语义网和知识网格语义网/知识网格虽是数字资源整合的发展趋势,但尚处于一种构想状态,离实际应用还有相当距离。如Tim burners Lee给出的语义网的结构体系,是万维网由数据网、信息网转化为知识网的解决方案,但自2000年提出后,国内对其研究一直处于各层次功能作用的解释上,其中位于语义网顶部的Logic、Proof和Trust尚没有重要研究成果,对其他四个层次以及与其相关的理论与技术问题的研究,特别是对实际应用起指导作用的研究成果尚不多见。知识网格的研究刚刚起步。知识网格的理论、方法与技术体系的总体构建及各部分的深入研究是一个异常艰巨的任务。如知识网格的概念、特征、体系结构等基本问题,未有权威的被多领域认可的研究成果问世,特别是知识网格的核心――知识层的构建机制尚需要进行深入研究。文献[4]立足计算机科学领域,对知识网格的概念、特征、方法、模型及相关技术问题进行了初步梳理,为知识网格的进一步研究奠定了基础。但由于知识网格是涉及多学科的跨学科领域,如果不进行跨学科的协同研究,是很难形成引领实践的研究成果的。
  
  3应用研究趋势
  
  3.1数字资源整合范围与规模不断扩大
  3.1.1由对规范性资源的整合到注重对非规范性资源进行整合数字资源包括规范性和非规范性两类,前者经过一定程度的人工处理,格式相对稳定,对其整合也相对容易实现,后者则多为半结构化和非结构化的资源,对这类资源的整合相对困难。网格为数字资源整合提供了更为广阔的空间,同时P2P等技术的发展为数字资源整合范围的不断扩大提供了有利的技术实现手段[5]。对Web动态的、非规范性资源整合系统的构建将成为人们关注的焦点。
  3.1.2由对资源的整合逐步扩展到对应用程序、服务等功能进行整合随着网格、SOA、WebService的相继出现,国内外学者对整合的研究不再局限于资源本身,而是开始探索如何重组、集成与资源相关的应用程序和服务,扩展其可重用性,避免重复开发,提高网络的运行效益[6]。
  3.1.3与个性化需求更加紧密地融合其主要特点表现为服务方式从简单的请求/应答式转变为定制/服务式,整合目标不再是为了解决单个的检索需求,而是面向用户的个性需求提供持久的跟踪服务,支持主动的推送服务与知识检索服务[7]。目前构建的数字资源整合系统非常关注资源的集成与整合,而较为忽略用户需求方面的差异性和个性化。然而,用户需求是多样的,面向个性化用户需求构建的整合系统将成为未来趋势。
  3.2知识整合是数字资源整合的主流趋势
  3.2.1更加注重新型知识组织体系在知识整合中的应用面对具有多样性、复杂性特征的数字资源,传统的知识组织工具显得力不从心,由此促进了对新型知识组织体系的研究和应用。人们意识到,传统知识组织和网络时代的知识组织有共性之处,都是对人类知识结构进行表达和有组织的阐述的语义工具,但后者并不是前者的简单重复或改良,而是螺旋式上升的质的飞跃[8]。目前,对本体、主题图、概念图、词网等概念关联类知识组织体系的研究成为新的焦点,包括新型知识组织体系和传统知识组织体系间的集成与互补,新型知识组织体系间的内在联系和功能整合等。
  3.2.2领域本体的构建将成为知识整合的研究重心领域本体构建研究与应用的重心包括以下四方面:①对本体构建的理论、方法与技术进行深入研究,建立领域公认的核心概念和完整的本体构建的理论体系以及具有适用性、针对性的本体构建技术体系;②面向某一应用领域进行领域本体系统的构建实验,包括初始本体的建立、本体的语义标注、本体的进化与学习、本体的管理、本体的展示与服务等整个过程;③在此基础上、总结经验、寻找规律,将其提升为理性认识,再进一步指导实践,以促进领域本体的实验研究更快、更有效地走向应用;④引入新的研究方法和手段,以增强本体系统的功能。文献[9]提出将内容分析法与本体结合的研究思路,构建了基于本体的内容分析系统,为本体研究提供了一种新的研究路径。
  3.2.3语义标引是研究与应用的重中之重怎样按照已构建的本体概念体系,对资源对象进行概念抽取、分析、分类、描述和处理,是本体建设的重中之重。国外许多大学和研究机构正在研究和开发Web内容的语义标注工具,语义Web标注与编辑网(SEMANTIC WEB Annotation & Authoring)发布了13种基于本体的语义标注工具。文献[10]对这些语义标注工具进行了介绍和比较,文献[11]提出了一种基于领域本体的语义标引方法,并给出基于领域本体的语义标引过程。但目前对本体标注系统的研究还比较肤浅。理想的本体标引系统应该具有通用性,支持协同编辑,具有知识表达能力,支持多语言标引,具有自动分类、自动或半自动的知识获取与标引[12],同时还应该支持本体的学习与进化。
  3.3语义网/知识网格将成为数字资源整合的最终归宿
  语义网是以知识资源为基础的人类知识整合的大环境,是人类知识的一个宏观网络,本体是语义网构建的核心和基础,各个领域本体的构建对于语义网的实现至关重要。而基于本体的资源整合是数字资源整合的高级阶段,所以数字资源整合一个重要的应用与研究发展趋势就是融入语义网大环境。知识网格还是一种理念。文献[13]认为:知识网格是一个智能的并充足的互联环境,能使用户或虚拟角色有效的获取、整理、发布、理解、共享和管理知识资源,并为用户提供所需要的知识服务,辅助实现知识创新、协同工作、问题解决和决策支持。这一定义目前被国内学者引用较多。需要关注的是,知识网格不是空中阁楼,它存在于现有的理论、方法和技术之上。知识网格作为知识组织和知识管理的技术框架,离不开知识资源的支撑,知识网格的实现需要以各个领域的知识资源体系为基础。
  
  4技术研究与应用趋势
  
  4.1网格
  网格(Grid)是一种新的对资源/服务的集成技术,其本质是一种资源共享/协同的理念和思想[14]。根据不同的资源对象,网格分为逐次递进的三层,即数据/计算层、信息层和知识层[15]。“数据/计算层” 的主要特点是可以处理大量的数据;“信息层”的功用主要解决异构信息的统一访问;“知识层”的特点是可以对多源、异构、海量、复杂、动态的信息进行一体化的智能处理与组织,使用户能够有效地获取、发布、共享和管理知识资源,提供所需的知识服务。目前国外已在开展基于网格技术整合数字资源与服务的研究,如DELOS、FreeLib、DILIGENT、GRACE等项目[16]。利用网格技术整合资源将是未来数字资源整合的发展趋势。其研究与应用主要体现在以下两方面:①利用网格技术进行基于信息层面的资源整合。如异构数据库系统的整合应用、信息门户的整合应用等。文献[17]提出在原有OAI-PMH框架基础上引入网格,可以更好地解决资源发现、整合、跨仓储检索等问题;②利用网格技术进行基于知识层面的资源整合。研究内容包括:知识获取与知识表示的理论、模型、方法和机制,知识可视化和创新,动态虚拟组织间进行有效的知识传播和知识管理,知识的有效组织、评估、提炼和衍生,知识关联和集成[18]。资源的语义组织是网格研究的基点也是难点,而本体是网格资源语义组织的关键,将网格和本体有机结合起来是网格研究与构建的趋势。如文献[19]提出了一个基于本体的通用知识网格(UKG)架构模型;文献[20]提出本体是知识网格的构建基础和关键所在,本体学习的研究与发展必将从根本上改变网格环境下知识系统的构建方式。
  4.2P2P
  P2P(Peer to Peer)作为一种对等计算技术,其核心思想是:所有参与系统的结点是逻辑对等的(称为对等点)。其目的是将网络中不同的计算机连接起来,通过直接互连实现信息资源、处理器资源、存储资源甚至高速缓存资源等的全面共享。由于P2P具有高度分布化、对等性、协同性、能够动态发现并快速访问资源等优势[21],使其具有广泛的应用前景。P2P与网格有很多相似之处,但也有明显的区别。例如网格的主要目的是实现大规模的、灵活的、安全的以及协同的资源共享,构成网格系统的节点一般都是高性能计算机节点,而P2P主要面向的是桌面PC机,通过大量节点之间的直接通信来共享各种计算资源;网格节点具有很高的稳定性和可靠性,而P2P是一种更加松散的结构等[22]。随着研究的发展,人们认识到网格和P2P存在互补性,应该将两者加以整合,共同构筑下一代互联网基础设施,共同构建一个集高性能服务器和普通桌面PC于一体的网络共享环境。P2P技术的发展以及同网格技术的汇融,为数字资源整合范围的扩大和功能的提升提供了有利的技术实现手段。在这方面,文献[7]介绍了英国、挪威等国的基于P2P技术的资源整合方案。
  4.3SOA
  SOA(Service Oriented Architecture)是一个面向服务的软件系统框架。在这种框架下,一种服务被封装为一个部件,一个SOA实质上就是一系列相互交互的服务集合,构建在这样的系统中的服务可以使用统一和标准的方式进行通信,也可以调用多个服务协同工作。由于SOA集成的对象是一个个的服务,由于服务基于开放的技术标准,支持服务接口描述和服务处理的分离、服务描述的集中化存储和发布、服务的自动查找和动态绑定以及服务的组合,因此可以满足对于资源与服务整合的要求。所以SOA一经提出,首先得到企业的青睐,许多企业开始考虑构建基于SOA的资源整合系统[23]。基于SOA架构的整合系统包括三层关键结构,最底层是数据层,包括结构化的数据和非结构化的内容;中间层是集成工具,能够将底层数据的异构和分布结构屏蔽,提供清晰明确的统一视图;最上层是应用工具,能够提供用户所需的服务,便捷、高效的实现各种应用。文献[7]介绍了Patrick C. K. Hung结合工作流管理提出的由应用层、工作流层、服务层、消息组成的SOA整合系统4层结构。由于SOA具有标准化、可重用性、可扩展性、集成效率高等优势,在SOA架构中能够将数据和内容有效整合,与服务无缝链接,为资源整合提供了更优化的解决方案。当前SOA正在与网格、P2P、Web服务技术相结合,增强并拓展了自身的服务集成功能,在资源整合与服务整合方面将发挥重要作用。
  4.4Web服务
  Web服务(Web Services)是一种基于XML语言和标准网络协议实现的分布式计算技术,它力图构建一种松散耦合环境下服务的描述、发现、调用以及集成的通用框架模型。与传统的Web应用技术相比较,Web服务技术具有高度的可集成能力、完好的封装性、数据松散藕合、跨平台、开放性、支持的开发工具多等特性[24],目前正逐步应用于异构信息资源系统的集成与整合,在现有的各种异构平台的基础上构筑一个通用的与平台、语言无关的技术层,各种不同平台之上的应用依赖这个技术层来实现彼此的连接和集成[25-26]。当前,Web服务技术的研究与应用向以下两方面拓展:①与网格技术互补融合[27]。Web服务和网格都是为了解决互联网上巨大的资源的共享和互操作从不同角度提出的解决方案,因此在发展过程必然会走到一起。文献[28]给出了一种服务体系结构协议,剖析了将网格系统的五层沙漏结构与Web服务技术结合起来的开放网格服务体系结构 ;②与语义Web/本体互补融合。本体使万维网资源具有语义,也可以使基于资源的服务具有语义;使用本体对Web服务进行语义描述,并利用本体语义进行Web服务发现,这样就能共享和集成知识资源、应用程序和相应的服务。文献[29]提出了将语义添加到Web服务的两个标准(WSDL和UDDI)中以增强Web服务描述能力的方法。
  目前,Web服务技术还处在不断发展之中。它和网格、P2P、SOA、语义Web技术的优势互补,在跨平台解决异构资源系统方面表现出更加灵活和更加强大的功能,也为数字资源在各个层面上的集成与整合提供了一个新的可行方向。
  
  5结语
  
  对数字资源整合理论进行系统、全面的研究,明晰数字资源整合应用的必然发展,把握对数字资源整合未来具有重大影响的新型技术,无疑对数字资源整合的可持续发展具有重要意义。本文结合国内数字资源整合研究现状,对数字资源整合在理论、应用与技术方面的主要趋势进行了初步的梳理和分析,以期对国内数字资源整合的研究与应用以启示。
  
  参考文献:
  [1] 温有奎,徐国华,赖伯年,等.知识元挖掘.西安:西安电子科技大学出版社,2005:1.
  [2] 牟冬梅,毕强.语义Web技术对知识组织理论和实践的影响研究.图书情报工作,2006(6):6-10,33.
  [3] 李宁,宋文.对于知识组织体系概念以及构建模式的一些思考.图书情报工作,2005(10):37-40.
  [4] Zhuge Hai. The Knowledge Grid. Singapore: World Scientific Publishing Co, 2004:2-172.
  [5] 黄永文.Web整合系统的分析与研究.图书情报工作,2005(10):11-14.
  [6] 李广建.整合研究的几个理论问题.图书情报工作,2005(10):6-10.
  [7] 李春旺.Web信息整合机制研究.图书情报工作,2005(10):15-19.
  [8] 闫巍,曾民族.构筑知识基础结构的关健技术.现代图书情报技术,2005(11):1-6,31.
  [9] 王曰芬,颜端武,邱均平.基于Ontology的内容分析法――内容分析系统架构与运行机理研究.中国图书馆学报,2006(3):24-27.
  [10] 陶皖,李平,廖述梅.当前基于本体的语义标注工具的分析.安徽工程科技学院学报,2005(6):52-55.
  [11] 秦春秀,赵捧未,窦永香.一种基于本体的语义标引方法.情报理论与实践,2005(3):244-246.
  [12] 韩毅,毕强,崔春.语义Web门户知识组织的策略与应用研究.图书情报工作,2006(6):17-22.
  [13] Zhuge Hai. China? e-science knowledge grid environment. IEEE Intelligent Systems, 2004,19(1):13-17.
  [14] 徐志伟,冯柏明,李伟.网格计算技术.北京:电子工业出版社,2004:1.
  [15] Roure D D, Jennings N R, Shadbolt N R.语义网格:未来e-Science的基础设施//Berman F, Fox G C, Hey T.网格计算:支持全球化资源共享与协作的关键技术.都志辉,等译.武汉:华中科技大学出版社,2005:344.
  [16] 韩毅,毕强,李贺.国外基于网格技术的数字图书馆内容与应用的比较研究.情报学报,2006(2):221-230.
  [17] 郑志蕴,徐玮,宋瀚涛,等.网格环境下基于OAI的数字图书馆互操作机制.计算机工程,2006(5):37-39.
  [18] 诸葛海.知识网格.[2006-08-06].http://www.ict.省略/jcst/downloads/xsqy/qy1301.pdf.
  [19] 李玉华,卢正鼎,廖振松.基于本体的通用知识网格架构研究.华中科技大学学报(自然科学版),2006(3):21-24.
  [20] 刘柏嵩,高济.面向知识网格的本体学习研究.计算机工程与应用,2005(20):1-5.
  [21] 张智,杨俊,李瑞轩.面向服务的P2P模型研究.计算机应用研究,2005(9):63-64,80.
  [22] 罗建光,杨士强.对等互通 自由共享 P2P更多地是一种思想.[2006-08-11].http://sj.media.省略/index1.php?IDx= 50&id=9.
  [23] 吕希艳,张润彤.基于SOA的企业信息资源整合.中国科技论坛,2006(2):103-105.
  [24] 李亚红,吴江,贾晖,等.基于Web Services实现异构数据库集成技术研究.计算机应用研究,2006(2):81-83,86.
  [25] 张驰,黄广君,吴健,等.分布式组件与Web服务集成技术研究.微电子学与计算机,2006(3):146-149.
  [26] 田世海,高长元.基于Web Services的高技术虚拟企业信息集成.中国软科学,2006(6):150-155.
  [27] 杜小勇,马文峰.数字资源集成系统体系结构研究.情报资料工作,2005(3):42-45.
  [28] 杨昭昭,黄必清,颜波,等.基于Web服务的应用网格体系结构研究.计算机应用研究,2005(7):229-233.
  [29] 唐庆梅,熊齐邦.语义Web和Web服务标准集成的研究.计算机工程,2006(2):136-139.
  〔作者简介〕 马文峰,女,1953年生,教授,发表论60余篇,独著(合著)著作7部。
   杜小勇,男,1963年生,教授,博士生导师,发表论文100余篇。

相关热词搜索:发展趋势 资源整合 数字 数字资源整合的发展趋势 海宁整合数字资源 乌镇整合数字资源

版权所有 蒲公英文摘 www.zhaoqt.net