【机构库共享机制研究】机构和机制的区别

发布时间:2020-03-07 来源: 人生感悟 点击:

  [摘要]通过开放存取发展趋势和机构库现状的研究,从三个角度提出机构库共享的必要性。在信息资源共享原则的基础上,结合机构库自身的特点,深入分析机构库的共享原则。最后通过探析机构共享发展阶段,结合OAIS长期存取框架,并利用OAI-PMH互操作协议,构建机构库长期联合共享模型。
  [关键词]机构库 资源共享 开放存取 OAIS OAI-PMH
  [分类号]G250.74
  
  开放存取(Open Access,简称OA)是国际科技界、学术界、出版界、信息传播界为推动科研成果利用网络自由传播而发起的运动。随着经济和技术的发展,传统学术出版模式严重阻滞了学术交流的发展,期刊价格的升幅远远超出了机构图书馆经费预算所能承受的范围,图书馆只能在有限的经费中削减订购,而出版商为了保障自己固有的商业利润不断提高期刊价格,这样图书馆期刊购买经费与出版商利润之间就一直存在着矛盾,形成了一种恶性循环。国际上实现开放获取主要有两种途径:一种是通过开放获取期刊(OA Jour-nals),被称为“金色道路”(Gold Road);另一种是通过作者自存储(Author self-archiving)将个人研究成果存储到开放获取知识库中,被称为“绿色道路”(GreenRoad)。
  开放存取的发展,加之web技术的进步,机构库得以迅速发展。机构库基于开放存取理念而建立,作为开放获取运动最重要的模式之一,机构库在保存机构的学术成果、求得成果内容永久的揭示与获取,增加学者个人、单位和院系研究的可见性,替代商业出版社的垄断出版行为等方面发挥重要作用,对作者、用户、大学和课题资助者及图书馆等各方都有好处,成为网络学术交流体系中的主要组成部分。国外许多机构都在进行知识库的建设,许多国家和研究机构也制定各种政策扶持机构库的研究与运作,包括强制性开放获取政策。全球的机构库处于高速增长时期,如今机构库已经成为图书馆研究的热点,并成为开放存取运动的主角。
  
  1、机构库简介
  
  1.1 机构库概念
  目前,国内外关于机构库的研究和应用很多。但是对机构库的概念上仍存在分歧。但是笔者认为他们只是研究的视角不同而已,对机构库本质内容的定义大体是一致的:机构库是对特定范围内的知识资源进行搜集、组织、数字存储、管理,并最终将其中绝大部分资源对任何网络用户免费共享的知识库。
  1.1.1 机构库发展现状 2000年惠普公司斥资1800万美元,与麻省理工学院(Massachusetts institution oftechnology,MIT)合作开发DSpace;2001年,俄亥俄州立大学的行政官员和该馆馆长布兰宁(Joseph J.Bra.nin)在探头开发远程教育体系时,提出建立俄亥俄州立大学知识库,以保存该校师生员工的数字资源,这成为机构库最初的雏形。2002年11月DSpace正式面世,机构库以不可思议的速度在全球范围内迅速扩展,并朝着全球知识共享的目标迈进。
  目前全球机构库建设正处于高速增长期,根据著名机构库登记机构Registry of Open Access Repositories(ROAR)的统计结果显示:截止到2009年2月,全球机构库已经增加至l 256个,记录数据达上千万条(12 616 668),如图1所示:
  机构库发展迅速但是发展却不平衡,根据著名机构库登记机构Registry of Open Access Repositories(ROAR)的统计结果显示,排名前五名的是:美国(266),英国(131),德国(99),日本(64),巴西(63)和西班牙,加拿大(48)。中国等发展中国家则发展相对落后,如图2所示:
  
  2、机构库共享机制研究的必要性
  
  2.1 机构库构建中存在着隐患
  全球机构库的数量迅速猛增,许多机构都在积极筹建机构库。但是在建库的过程中,各机构正处于独自竞争发展阶段,旨在建立适合本机构的知识库。短期来看,这对于机构库的发展,机构库的质量提高都大有益处。但从长远角度考虑,机构库现在的构建存在着隐患:各机构建库标准不统一,相互协调不足,加之技术等因素,很难实现各机构库的联合共享,这样必然造成资源的重复建设,不益于机构库的长期发展。在机构库的构建中,必须始终强调其共享性。
  2.2 开放存取的必然要求
  机构库源于开放存取的发展,机构库是基于开放存取理念建立的。所以机构库必须始终坚持开放存取的目标――共享。这样才能和一般的学科库相区别,发挥自身的优势。机构库在发展过程中要充分考虑本机构的特点和需求,真正实现为机构服务。但长远来看更要注重共享,尤其是跨机构共享,这样才能利用整合最新的资源,进一步推进创新。
  2.3 机构库发展趋势
  现在的研究热点多聚焦于特定机构库的构建之中。如机构库质量控制,长期保存问题等。但机构库发展的趋势无疑是更好的共享、更广范围内的共享,终极目标是实现全球范围内资源联合共享。
  
  3、机构库共享原则
  
  作为信息资源管理的一种方式,信息资源共享的一般原则,在机构库共享中同样适用。
  3.1 信息资源共享的一般原则
  信息资源共享的最终目的是最大限度满足用户的信息资源需求。可以将其概括为“5A理论”,即任何用户(Any user)在任何时(Anytime)、任何地点(Any-where),均可以获得任何图书馆(Any library)拥有的任何信息资源(Any information resource)。
  信息资源共享理论的基本原则主要体现在以下几点:
  ?自愿原则:自愿原则是信息资源共享的前提原则。所谓自愿原则是指信息资源共享的参与者主观意志和主观行为的自觉、自主、自为和自律。
  ?平等原则:平等原则是信息资源共享的基础原则。只要是信息资源共享的参与者,在信息资源共享的体系中就都具有平等的责任、权利和义务。
  ?互惠原则:互惠原则是信息资源共享的根本原则。它是指所有参与者在信息资源共享中彼此之间都能够获得平等的利益,并由此最大限度满足用户的信息资源需求。
  3.2 机构库共享原则
  3.2.1 标准化原则 标准化是机构库共享中的首要原则,根据中国标准化协会的定义,所谓标准是指在一定范围内获得最佳秩序,对活动或其结果规定共同的和重复使用的规则、导则或特性的文件。它包括制定、发布及实施标准的过程。标准化的重要意义是改进产品、过程和服务的适用性,防止贸易壁垒,促进技术合作。标准化的实质和目的是通过制定、发布和实施标准,达到统一,获得最佳秩序和社会效益。对于机构库而已,必须遵循标准化原则,这样才能避免数字资源早期建设的“以己为政“的错误,防止重复建设浪费。在机构库中,在信息资源数字格式,质量标准和使 用的获取技术上等,都必须遵从通用的标准,这样才能在不同机构库之间,甚至在其他的资源存储系统中实现一个互联的共享网络体系。
  3.2.2 可持续性原则 机构库发展中必须坚持可持续原则,这是机构库共享的前提。可持续性原则源于第38届联合国大会提出的“持续发展”。第38届联合国大会提出“持续发展”是21世纪不论发达国家还是发展中国家正确处理与协调人口、资源、环境、经济相互关系的共同发展战略,是人类求得生存和发展的唯一选择。机构库共享的可持续性原则,是指共享不应只是一个即时理念,而是一个长期的可持续共享。必须保证资源的长期保持,实现机构库的持续性共享。
  3.2.3 系统性原则 机构库的共享是一个系统性的问题。共享牵涉到共享的多方参与,要用系统的观点,协调各方利益。系统性原则是一个总的指导原则,只有在系统原则的指导下,才有可能真正实现共享。
  
  4、机构库共享阶段研究
  
  机构库共享的终极目标是在全球范围内实现不同机构库之间及与其他数字资源库的共享联盟。从机构库共享程度出发,笔者将机构库的共享发展大致划分为4个阶段:竞争性独立发展阶段,机构库间相互共享阶段,与其他数字资源库的共享阶段,遵循OAI协议的全球共享联盟阶段,如图3所示:
  4.1 竞争性独立发展阶段
  在机构库发展初期,各机构的主要任务是构建适合本单位的机构库,主要关注本机构的资源数量及质量问题。共享目光基本还没有涉及到机构间共享层面,仍停留在本机构资源的共享整合。
  我国的机构库发展大多停滞在这个阶段,如香港科技大学图书馆机构库(HKUST)、图书馆情报学开放文库、中国预印本服务系统、奇迹文库等。机构库的数量和质量都没有达到共享的基本要求。
  4.2 机构库间相互共享阶段(遵循OAI协议共享)
  机构库发展到较为成熟的阶段,步入正轨。为了最大限度发挥机构库的作用,各机构库都有寻求相互共享的需求。这种共享,可以是库内容的共享,也可能是库构建及管理经验的共享。由于都为机构库,在遵循OAI协议的基础上,能较快达到这个共享阶段。
  现在国外的机构库发展比较迅速,在美国,印度等国家,有许多遵循OAI协议共享的成功实例。如印度Kharagpur的理工中心学院,就利用OAI互操作协议,实现了中心学院和7个学院分校的共享。
  4.3 与其他数字资源库的共享阶段(异构数据高度集成)
  机构库间实现了共享,资源虽比较丰富,但仍有很多宝贵的资源在各机构库间是无法获取的,需要从其他数字资源库共享(如学科知识库,高校数字档案馆)。机构库要寻求新的发展空间,必须尝试实现与与其他数字资源库的共享。由于机构库和其他数字资源库在构建标准上有很多不同,共享的实现有一定难度,在技术上与标准上都会有很多难题需要解决,但在遵循OAI协议的基础上,这个共享阶段是可能达到的。
  由于资源格式标准不统一,实现联合的共享有很多技术难关需要攻破。根据现今的资料,笔者未能找到成功的实例。仅有的也只是把其他资源库的资源转载到新建的机构库中。如美国马萨诸塞州的州立医学院,就尝试过将已有的图像资源数据库转载到机构库中,但对于技术实现细节,没有详细的说明。
  4.4 全球共享联盟阶段(分布式高度集成共享)
  随着web技术的发展,机构库的共享还必须整合因特网的宝贵资源,这样才能最终实现开放存取,实现最大意义上的共享,形成全球共享联盟。
  作为机构库发展的终极目标,国外许多机构库大学团体,在孜孜不倦的探索着。如加拿大拉瓦尔大学在一个名为Archime"de的项目中,就提供了分布式高度集成共享的技术实现框架。里面使用了新的OAI―PMH2互操作协议,并提供了索引和搜索的框架(Ll-us)及GPL许可协议,用于实现不同标准资源格式的互联网分布共享。其中涉及较多技术细节,有待进一步考证,但可以预计在不远的将来,全球共享联盟阶段的前景是光明的。
  
  5、机构库共享模型构建
  
  机构库的共享是一个系统的工程,机构库内容的搜集、录入、管理、共享利用必须坚持系统的观点,相互协调。同时机构库共享必须在可持续原则指导下,实现长期的可存取性。因此,笔者基于OAIS参考模型与OAI-PMH共享协议,搭建了机构库共享模型。
  
  5.1 OAIS参考模型
  1995年,在国际标准化组织(ISO)的请求下,美国国家航空和航天局的空间数据系统咨询委员会(Consultative Committee for Space Data Systems.CCS-DS)开始开发一个旨在对数字资源的存取标准和长期保存规定概念和参考框架。CCSDS的这一工作导致1999年5月开放档案信息系统(Open Archival Informa-tion system,OAIS)参考模型的雏形公布,这一参考模型针对数字信息的长期保存和维护的档案系统提供一个概念性的框架。OAIS参考模型提供了一个完整的档案信息保存功能,它包括摄入、档案存储、数据管理、存取和分发。
  5.1.1 OAIS的环境 OAIS观点认为,一个OAIS是一个置身于生产者、用户和管理者之间的一个存档体系,如图4所示:
  ?信息生产者:是指提供用于保存信息的人员或客户端系统。
  ?管理者:是指那些制定数字档案馆系统全部政策的角色,它的唯一职责是通过制定政策控制档案的有效管理。管理者不参与日常档案业务操作,日常档案管理职责由数字档案馆系统中的管理功能实体完成。
  ?用户:是指通过与数字档案馆服务交互,发现与获取对数字信息感兴趣的人员或客户端系统。
  5.1.2 机构库功能模型在OAIS的基础上,笔者提出了机构库功能模型,其中包括6个功能实体和3种信息包。(见图5)。
  提交功能:提交功能模块负责接收机构成员提交文献的信息包(SIP)。
  元数据管理:元数据管理模块负责管理日常的数据长期存储的操作过程。
  电子文献归档:电子文献归档模块负责将各种数据化信息存储在保存系统中。
  系统管理:系统管理模块负责监控各个模块的运行。
  保存规划:保存规划模块负责制定机构库功能模型的保存策略。
  存取功能:存取模块具有负责允许用户检索所需信息的功能,同时附有权限认证与管理功能。
  5.2 OAI-PMH互操作框架
  OAI-PMH元数据收割协议(Open Archives Initia-tive Protocol for Metadata Harvesting),是一种独立于应用的、能够提高资源共享范围和能力的互操作协议标准。它具有操作容易、开放性,采用XML与HTrP等开放标准,相容性高等优点。
  OAI-PMH提供了一个基于元数据收获的与应用无关的互操作框架,如图6所示:
  在OAI互操作框架中,OAI―PMH定义了两个角 色:数据提供方DP(Data Provider)和服务提供方sP(Service Provider)。数据提供方和服务提供方通过OAIRequest和OAI Response来实现信息的传递。服务提供方通过OAI Request从数据提供方中获取元数据,数据提供方对来自服务提供方的OAIRequest做出响应,并以OAI Response格式向服务提供方提供元数据。一个服务提供方可从多个数据提供方处获取元数据,而一个数据提供方可向多个服务提供方提供元数据,数据提供方与服务提供方之间是多对多的关系。
  在实际中,SP与DP可以是不同机构,也可以属于同一机构,因为大多数机构既是服务提供者也是数据提供者。
  5.3 基于OAIS与OAI-PMH的机构库共享模型
  机构库的长期可存取是实现共享的基础,在充分了解机构库资源长期存取框架OAIS的基础上,结合OAI-PMH标准协议就可以实现机构库资源共享机制模型,如图7所示:
  在机构库共享机制模型中,机构库之间构成了一个共享联盟,在遵循OAIS参考框架与OAI-PMH协议的前提下,实现了机构库之间资源的共享。当提交者将文件提交到机构库存储系统中时,系统以SIP形式提交内容信息,包括元数据信息与内容信息实体,在所提交的SIP得到确认后,管理者根据保存规划(存储内容开放期限、提交内容标准与政策等)对所确认的SIP进行存储,并赋予其相应的管理与描述性元数据进行存储与管理维护,然后通过DIP根据用户查询指令响应结果集。每个机构库作为全球数字资源管理系统的重要组成部分,同时也是机构库共享技术标准接口OAI-PMH协议中的一个数据提供方(DP),当用户通过服务提供方(SP),例如OAIster等提供的统一检索界面发出搜索请求时,服务提供方的采集器将采集到的数据进行处理、重组,建立索引,将采集的已经处理好的数据存储到数据库,通过统一检索界面返馈给用户。
  在基于OAI-PMH协议的机构库共享机制模型中,无论是作为数据提供方的机构库,还是作为服务提供方的搜索引擎,都必须通过注册服务器进行注册,机构库在注册成功并获得分配URL地址之后,才能发布元数据及响应回答服务提供方的请求,服务提供方在注册成功并获得分配的URL地址后,才能组织和管理元数据,只有这样才能真正实现机构库的资源共享。
  5.4 共享模型前景展望
  由共享机制模型可以看出,机构库之间的共享只是机构库共享的一个组成部分,对机构库来说,其所遵循的标准是其构成整个数字资源共享的重要平台,只要其他数字知识库与机构库之间在长期存取框架下通过遵循OAI-PMH协议实现元数据的互操作,就可以实现资源共通互联,真正形成共享的网络体系与网络联盟。

相关热词搜索:机制 机构 共享 机构库共享机制研究 高校机构库实现机制研究 共享库机制的研究doc doc

版权所有 蒲公英文摘 www.zhaoqt.net