本体感觉评估量表 本体评估工具的比较分析

发布时间:2020-03-07 来源: 历史回眸 点击:

  [摘要] 对ODEval、OntoQA、Core、OntoManager四个本体评估工具的系统结构体系进行分析,从工具所用的评估方法、工具的评估机制、工具的使用者、工具的作用范围、工具的可操作性及有效性5个层面进行比较分析,明确其各自侧重点和差异,以帮助本体开发者及最终用户选择适合自身需要的在国际范围应用广泛、具备发展前景的本体评估工具。
  [关键词] 本体评估工具 ODEval OntoQA Core OntoManager 工具比较
  [分类号] G354.2
  
  1 引 言
  
  目前,本体通过提供某个特定领域的相关概念及这些概念之间的关系而广泛应用于知识工程、信息组织及语义Web等各个方面。随着本体体系的发展,对本体进行评估成为本体发展中的关键问题。一方面,本体评估对于指导本体构建过程并保证所构建本体最大程度地满足应用需求起重要作用;另一方面,最终用户选择最符合自身需要的本体时,本体评估也是必不可少的。此外,本体评估在本体重用、自动或半自动的本体学习技术以及本体管理与规范化建设中都有着重要作用。
  我国关于本体的建设与研究尚处在不断完善的过程中,对本体的评估研究才刚刚起步,国外对于本体的评估已受到专家学者关注。本文基于目前国内外本体评估方法类型及其研究现状,选择并分析了目前应用比较广泛的四种本体评估工具ODEval、OntoQA、Core、OntoManager,旨在通过对这些工具的比较研究帮助本体开发者及最终用户选择适合自身需要的评估工具,并促进本体的规范化建设。
  
  2 本体评估方法
  
  本体评估的核心是评估角度的全面化,即以多维视角的评估内容来综合衡量本体的质量。当前研究者从不同角度提出各种类型的本体评估方法,如Onto-Metric、oQual、OntoClean等,综合各类方法,Jannz Brank等人把本体评估方法分为以下四类:
  ?基于“黄金标准”的方法,即将所构建的本体与一个现有公认的比较成熟的“黄金标准”进行比较,罗列出其不足并进行改进。
  ?基于本体应用的方法,即在一个特定应用环境如语义网、信息检索中,测试一组本体以确定适合该应用的本体。
  ?基于语料库的方法,即使用术语抽取算法从语料库中抽出术语,计算被本体覆盖的术语数量,或是用一个向量来表示本体和语料库,然后计算本体向量与语料向量之间的差距。
  ?基于一套预先定义好的原则和必要条件等进行评估的方法,其多是从构建本体的原则来评估本体。
  随着越来越多本体评估方法的提出,创建能够运用这些方法从而使评估工作更易进行的本体评估工具就显得越来越重要。笔者选用的四个本体评估工具:ODEval、OntoQA、Core、OntoManager的创建都使用了上述一种或几种方法,它们基于本体的不同侧面来检测本体构建规划、本体构建过程、本体应用以及本体维护等阶段出现的问题或错误,包括本体句法层面的正确与否、本体设计结构上的合适与否以及本体相对于领域知识表示完整与否等。
  
  3 国外现有本体评估工具
  
  3.1 ODEval
  ODEval是Corcho等人于2004年提出的,从知识表示角度评估用RDF(s)、DAML+OIL和OWL语言表示的本体的本体评估工具。
  ODEval使用基于图理论的运算法则来检测本体概念分类存在的问题。在这个运算法则中,把本体的概念类看作一个定向的曲线图G(V,A),其中V是一组节点,A是一组定向的弧线。节点集V和弧线集A所表示的具体元素因表示本体语言和问题类型的不同而有所差异。如表1所示:
  
  
  3.2 OntoQA
  OntoQA是Samir等人于2005年提出的结合了用户需要对本体进行评估的工具。OntoQA提供具体的指标来定量评估本体的质量。评估指标分为两类:模式(schema)指标和实例(instance)指标。模式指标组指用来评估本体结构设计的指标;实例指标组指评估本体内实例分布的指标,包括知识库指标和类指标。知识库指标将知识库作为一个整体来评估,类指标评估本体结构中定义的类在知识库中的运用方式。如表2所示:
  
  
  3.3 Core
  Core(Collaborative Ontology Reuse and Evaluationsystem)是Femdndez等人于2006年提出的基于本体排列的应用于本体重用和本体评估的工具。Core根据已选出的标准准则来评估本体,这个准则涉及黄金标准和用户需要两个方面。在黄金准则方面,Core通过词汇评估层面和分类评估层面对本体进行评估。词汇评估层面使用一套词汇评估方法评估黄金标准和所选本体的相似性,通过比较表示它们所描述领域的词汇条目来实现;分类评估层面评估所选本体的“is-a”层级结构和黄金标准结构的重叠程度。在此基础上,Core通过以下三个模块组成的体系结构来完成对一系列相关本体的评估:
  ?黄金标准技术设计模块:用户通过自然语言处理从其感兴趣的相关文档中得出根词汇,并使用WordNet和它提供的同义及反义关系扩展根词汇,以此构建包含新词汇的词汇黄金标准。
  ?系统推荐模块:用户选择一套评估准则,然后根据这套准则将所要评估的本体与黄金标准进行比较,选出并按相似度排列与黄金标准接近的本体。
  ?协作性评估模块:本体的某些特征(例如可读性、灵活性等)无法通过自动化的机器直接进行评估,因此需要用户参与,此模块综合用户需要及上述评估结果得出最终排序。
  
  3.4 OntoManager
  OntoManager是Nenad等人于2002年提出的一个适于本体工程师、领域专家及行业分析家使用的管理系统,它可以根据用户需要找出不足以促进本体完善,并能促进管理人员问责制的发展。其主要任务是通过收集用户应用本体的交互性数据来了解用户需求,以避免通过调查问卷等繁琐方式获取数据,从而评估本体满足用户需求情况。
  OntoManage的实现基于概念体系结构MAPE(Mo―nitor Analyze Plan Execute)模型,其把管理体系机构提炼为四个功能:①监控功能,收集、整理并过滤用户使用本体的交互性数据;②分析功能,整合所收集到的数据并使其可视化,提出本体修改建议;③计划功能,规划出适用于本体修改的行动;④执行功能,根据对本体做出的调整,更新本体的应用。整体来看,OntoManager由三个模块组成:
  ?数据整合模块:整合、收集、预处理并组织用户应用本体的行为信息数据。
  ?可视化模块:把上述数据以易于理解的可视化形式表示出来,即通过图表、表格、条形图等方式来实现。
  ?分析模块:引导本体进行改变以适应用户需要,从而完成本体进化完善以及实例抓取两项任务。   
  4 本体评估工具的比较分析
  
  不同的本体评估工具是从不同的视角针对不同领域的、不同类型的、用不同知识表示形式表示的本体而创建的,且没有一个本体评估工具能成功解决本体存在的所有问题。我们从评估方法、评估机制、使用者、作用范围、可操作性及有效性等指标来比较上述四种本体评估工具。指标的比较如表3所示:
  
  
  4.1 工具所用评估万法
  本体评估工具都是使用一定的评估方法来创建的,在选用评估方法上,本体评估工具会针对评价的重点及其评估视角来做相应选择。
  ODEval基于逻辑规则视角,通过本体表示语言的逻辑规则来评估本体。其使用了基于原则的评估方法。尽管目前一些本体剖析器和本体平台可用于检测用RDF(s)、DAML+OIL和OWL语言表示的本体,例如ICS-FORTH Validating RDF parser、OWL Validator等,但它们只能检测出简单的循环问题,而对于分割错误和冗余问题大多束手无策,而该工具可有效地评估本体内容中的不一致和冗余。
  OntoQA、Core都是基于指标视角的评估工具,利用指标的综合性从不同方面评估本体。OntoQA使用了基于语料库和基于原则的综合评估方法,通过具体指标帮助用户分析所选本体的适用性,Core使用了基于黄金标准和基于应用的评估方法来对本体进行评估并排序以供选择适用性高的本体。
  OntoManager基于本体进化视角,通过总结本体生命周期的变化来评估本体,例如领域知识的变化导致的本体内容结构的变化、本体知识表示语言的相互转化所导致的格式变化等。其使用了基于用户应用的评估方法,分析用户使用数据来持续管理、评估并完善本体。
  
  4.2 工具的评估机制
  ODEval作用于本体模型创建阶段,它执行RDF(s)、DAML+OIL和OWL本体的句法评估,它使用基于图理论的自动检测程序,通过对本体表示语言中词条的检测来检测本体创建过程中出现的本体概念分类的不一致和冗余等问题。OntoQA将所设计的评估指标存储于基于Java语言的程序原型中,运用SeasameRDF store来下载本体的模式和知识库,形成OntoQA本体评估工具。Core根据已选出的标准准则通过自动相似度检测方法对一组本体进行排序,即从其提供的标准准则中选择一个子集,而基于每种标准都可以得出一个本体排序,然后使用能把这些标准综合起来考虑的融合性排序技术并结合用户需要得出最终的本体排序。OntoManager通过门户网站或应用来关注最终用户需求,即跟踪用户在日志文档中应用的交互作用,收集有用的能够用于评估用户主要兴趣域的信息,通过这种信息的变化来寻找并及时反映本体领域知识所发生的变化,以此来评估并不断地完善本体,此机制表示为一个“使用环”,如图1所示:
  
  
  4.3 工具的使用者
  本体评估工具的使用者包括本体开发者和最终用户。前者包括本体构建者、本体管理人员等领域专家。本体开发者需要评估工具来完善本体;用户需要评估工具来对一组内容相近的本体的质量进行评估从而选择最适合其需要的本体。Sabou等认为本体选择和本体评估相互补充,起过滤作用的本体选择是先于本体质量评估的,且用户角度的本体评估工具有助于本体选择和本体评估的实施。目前随着本体使用范围的扩大,研究人员也开始关注最终用户对本体的评估。
  ODEval和OntoManager的使用者是本体开发者。ODEval适用于创建本体阶段的使用;OotoManager适用于本体构建完成后本体的更新完善阶段的使用。On-toQA和Core的使用者既包括本体开发者也包括最终用户。OntoQA是从用户视角创建的,为了更大程度地满足用户在评估本体质量基础上选择本体的需求;Core的实施在自动检测方法的基础上也需要最终用户的参与,以用户评价结果为重要组成部分。
  
  4.4 工具的作用范围
  Guarino把本体类型分为顶层本体、领域本体、任务本体和应用本体。顶层本体通常表达的是常识性概念,如空间、时间、事件、行为等,与具体应用无关。顶层本体可能没有实例填充,而其他本体在被构造好之后需要人工或自动、半自动化填充实例。有的本体评估工具仅作用于本体的模式而忽略了在被填充本体的知识库中运用的知识。
  ODEval因为其使用于本体模型构建阶段,只作用于本体的模式,而OntoQA、Core、OntoManager既作用于本体模式,也作用于本体的知识库,这样既对本体概念体系做出了相应的合适度评估,也对本体中实例分布情况、丰富程度、实例反应领域知识情况等做出了更全面的评估。
  
  4.5 工具的可操作性及有效性
  ODEval是一种自动检测工具,没有最终用户使用界面,但它易于被本体开发者所掌握,从而帮助本体开发者设计出没有知识概念分类异常的本体。
  OntoQA、Core、OntoManager都包含从用户角度进行评估的层面,可以确保在开发本体过程中所产生的建议反映用户的需要。OntoQA有易于操作的用户界面,且OntoQA正尝试开发可适用于Web的评估界面,适用范围会更广。
  Core有易于操作的用户界面,适用于本体评估和本体重用。用户可根据自身需要对页面上的指标进行设置从而得出最符合自身需要的本体排序,参考价值高,可操作性强。
  OntoManager根据用户需求来支持本体的管理和优化,它是一个易于管理人员使用的管理系统,但很难有深入的评估,不适合最终用户使用。

相关热词搜索:本体 评估 工具 本体评估工具的比较分析 本体评估方法研究综述 本体评估方法研究

版权所有 蒲公英文摘 www.zhaoqt.net