临床流行病学与循证医学 基于循证医学本体论的临床元数据设计方法研究

发布时间:2020-03-07 来源: 短文摘抄 点击:

  [摘要]临床实践中产生的海量临床信息是临床研究与临床实践最直接的证据,是医学领域不可或缺的、亟待科学挖掘的宝贵资源。基于循证医学本体论的临床元数据可用于l临床元数据语言的需求体系设计、语义结构体系设计及语法结构体系设计,从而可以达成对各种异构的临床诊疗信息的科学整合与深度挖掘以及共享利用。
  [关键词]循证医学 本体论 元数据 电子病历
  [分类号]G202
  1 引 言
  
  循证医学(Evidence-Based Medicine,EBM)是20世纪80年代才从医学实践中独立发展起来的一门新兴学科,也是一门极具生命力的基础理论研究科学。“循证”就是临床医生根据患者检查的实际情况,结合自己的经验,再依循前人最佳临床证据,对患者做出科学的诊治决策,提高医疗质量和诊治效果…。
  最佳临床证据的产生离不开真实、准确、完整的临床数据,最佳临床证据的获取离不开有效、全面、快速的检索途径。在这两个方面国内外医学机构都进行了积极探索,其探索的主要途径之一就是采用元数据,一方面对临床数据的主要来源(电子病历)的元数据进行标准化、互操作、共享性进行研究;另一方面,对循证医学信息进行组织时,采用元数据提高对循证医学信息资源科学、有效、全面、快速和方便的利用。
  
  
  由于电子病历研究是临床元数据研究的主要内容,全球医院信息管理的数字化趋势正加速电子病历的开发与研究。国际上具有影响的电子病历相关标准包括HL7、CEN 13606、OpenEHR、HeahhConnect等。
  著名的国际HL7组织对电子病历的研究已从最初的支持临床信息系统数据交换格式标准的研究而形成HL7参考信息模型(Reference Information Model,RIM)发展到关注临床病历本身内容的HL7 CDA,进而发展到目前对用于临床研究的电子病历功能需求模块提出执行方案(EHR/Clinical Research(EHR/CR)Functional Profile)。
  CEN 13606由欧洲标准委员会开发,用于电子健康记录交换和互操作的信息模型标准,目前该标准还未正式定稿。该信息模型由一系列的类(classes)和属性(attributes)构成。
  0penEHR是欧洲通信研究和技术发展计划制定的Good European HeM~care Record项目(后又称为Good Electronic Health Record,GEHR)经过十余年的发展而形成的。OpenEHR是电子病历系统用于信息表达的体系结构规范,它不仅借鉴了国际标准HL7、CEN13606的设计思想,也影响着这些国际标准的制定与修改,同时还与这些国际标准有着良好的接口。
  澳大利亚HealthConnect计划的临床信息项目(简称CIP)是为了在该国实现临床信息获取、保存、表达和利用的框架,也是支持电子医疗卫生信息交换和系统间临床信息互操作的框架。它的建立结合了ISO/IEC 11179信息技术一元数据注册库标准和OpenEHR的原型(archetype)格式。
  而对于电子病历用于循证医学的研究属于电子病历二次利用的范畴,国际上正处于起步阶段。主要的研究为HL7的用于临床研究的电子病历功能需求执行方案(EHR/Clinical Research(EHR/CR)FunctionalProfile)。该框架旨在构建能直接用于规范化、前瞻性临床研究的电子病历循证医学功能要求模块。尽管EHR/CR框架的最终目的是实现直接利用电子病历系统进行规范化临床研究,但它还没有发展到制定具体元数据的详细方案。
  在我国电子病历的研究也开始成为医院信息管理研究的热点。国内对电子病历的研究与开发主要是市场自主发展,缺乏政府或权威部门在政策面上搭建标准化平台,所以现有的电子病历系统开发仍处于各自为政的局面,难以实现电子病历系统交互使用和循证医学利用。因此,建立我国基于循证医学本体论的临床元数据体系已经势在必行。
  
  2 基于循证医学本体论的临床元数据在临床数据组织中的应用
  
  元数据(描述数据的数据)是一种人工编码语言,同时又是一种有效的知识组织的工具。它在临床数据的组织和管理中同样能发挥重要作用。
  我们采用循证医学本体论对临床元数据进行研究。来源于哲学领域的本体论探讨存在的本身,在信息领域应用时则指对概念及其关系的表达。我们的研究采用ISO/IEC 11179标准对本体论的定义,即本体论是在特定领域建立模型的类目元素网络结构,包括对象、对象属性、对象间关系的理论。其实质就是在特定领域中分类法和主题法有机结合而形成的语义网络体系。循证医学本体论则是从循证医学角度揭示概念的本质及其相互关系的语义网络体系研究。在循证医学本体论指导下的临床元数据语言研究能充分揭示l临床信息中概念本质及其关系,构建有效体系模型表达临床领域内特定知识结构,最终实现计算机网络环境下临床数据的规范表达、无缝链接、智能检索、知识挖掘等功能。
  2.1 临床元数据宏观体系设计
  临床元数据的循证医学本体论研究的主要内容是:①建立基于循证医学本体论的I临床元数据语言需求体系;②建立基于循证医学本体论的临床元数据语言语义结构体系;③建立基于循证医学本体论的临床元数据语言语法结构体系。
  通过对基于循证医学本体论的临床元数据的需求研究,建立适合我国国情的科学、全面、系统并具有可扩展性、可操作性的基于循证医学本体论的临床元数据语言,并基于临床文献原文、电子病历、数字图像文献,建立面向循证医学的临床元数据模型、元数据语义体系、元数据语法体系以及适合各类循证医学信息资源描述的专门元数据。具体如图1所示:
  图1表达了建立基于循证医学本体论的临床元数据语言宏观体系设计。建立高质量的元数据标准首先都需要进行需求分析,临床元数据标准的研究也不例外,从不同角度和方法分析元数据需求,建立需求模型,形成临床元数据集。为了增强临床元数据的互操作性,应该考虑其与国内和国际标准的兼容。对临床元数据集中的元数据元素进行语义规范和表达能形成临床元数据语义模型,其中循证医学本体论是核心的语义建立方法。语法是实现语义功能的置标规则,在建立临床元数据语义模型后,还要建立临床元数据语法模型,形成完整的临床元数据方案,为电子病历系统,临床研究和临床知识库中临床元数据的结构、表达、功能实现提供了依据。
  2.2 基于循证医学本体论的临床元数据语言需求体系设计
  临床元数据需求的研究方法采用自上而下的演绎法、自下而上的归纳法和系统集成法。在自上而下的演绎法中,从临床元数据需求的法规、标准、政策、规范等概括临床元数据。该方法不仅使临床元数据标准的 建立符合现行的法律、法规与规章制度,还能使元数据标准的建立与国际和国家标准兼容,实现临床数据共享。自下而上的归纳法主要通过搜集分析特定医院纸质病历或电子病历中临床数据、临床医生在临床研究中需要的临床数据以及临床文献中涉及的临床数据来确定临床元数据。最后采取系统集成法,系统地集成基于演绎法与归纳法的文献保证法、理论推演法、流程分析法来综合归纳,形成需求体系。“系统”意味着“全面”,“集成”意味着“有机构成”,这样就可以有效地集成各种分析方法的优长,使需求分析的结果是一个“整体”,而不是一个“拼盘”,从而保证临床元数据标准建立的科学性,满足基于循证医学本体论的临床元数据的概念模型框架建立,为语义元数据的制定及将其映射于语法元数据集奠定基础。
  2.3 临床元数据语义结构体系设计
  语义结构体系是元数据研究的核心内容,也是反应元数据本体论的呈现形式。在建立语义结构体系时不仅要考虑基于循证医学本体论的临床元数据自身适合的表现形式,同样也要使其表达与国内和国际标准相兼容。我们设计的『临床元数据语义结构将与目前国内现有标准《医药卫生科学数据共享元数据标准》、国际标准《ISO/IECLll79信息技术一数据元的规范与标准化一第三部分:数据元的基本属性》和OpenE-HR标准中的原型(archetype)设计等建立互操作接口,有助于对元数据元素语义进行科学、有序、统一、规范的分类与定义。
  从循证医学本体论的角度建立临床元数据的语义结构,应结合分析电子病历临床研究用元数据和临床文献中包含的主要J临床元数据以及各元数据之间的关系。临床文献中包含的临床元数据都应能在电子病历中找到对应元素。我们目前对中美有关消化系统疾病方面的回顾性研究论文进行了收集和全文分析,初步建立了回顾性临床研究(clinical retrospective re-search)、电子病历(electronic medical record)及医学知识库中临床文献库(medical knowledge base)之间的本体关系。
  回顾性研究形成的论文通常也采用国际通行的温哥华格式(IMRAD格式),即论文由前言(Imroduc.tion)、方法(Methods)、结果(Results)、讨论(Discus-sion)。不同的回顾性研究中每一部分包含的临床元数据都基本一致。
  前言部分一般是研究产生的动因,主要内容是临床实践中遇到的问题,或是与前人研究不同之处。其中前人的研究来源于医学知识库中临床文献数据库内容。虽然这部分内容不直接涉及到临床元数据,但如果电子病历系统与医学知识库实现了链接,那么也可通过电子病历系统直接获得这些信息。
  方法部分是研究的主要数据来源,电子病历中有关基线、诊断、用药、手术等信息均可在方法部分出现,是在临床研究中非常重要的检索点。如果电子病历系统中这些临床元数据能尽可能采用标准化语言著录,无疑将大大提高电子病历用于临床研究的优势。
  结果部分通常是预后的情况或各种检查结果等。
  讨论部分一般是该研究与其他相关研究的比较分析,因此也涉及到医学知识库中的临床文献库。 采用本体论编辑工具Prot6g63.3.1,建立临床元数据的语义网络模型如图2所示:
  模型图中电子病历、临床回顾研究、医学知识库中的临床文献库三个模块中的临床元数据组织方式不同,如临床回顾研究按照论文格式进行组织;电子病历可根据SOAP(主诉、客观症状、评估、诊疗计划)或本地电子病历体系来组织。本文的电子病历信息模型分类采用0penEHR电子病历信息模型中信息分类方法,即临床流程的分类方法。该方法将电子病历首先分为基线信息(demographies)和诊疗信息(care informa-tion),其中诊疗信息又分为历史记录(history)、指导(instruction)、评估(evaluation)等以及更细化的内容。虽然三个模块中临床元数据组织方式不同,但是却通过它们共同使用的临床元数据建立起相互关系。揭示出这种网络本体关系,有助于三个模块中概念及其关系的无歧义表达,建立清晰的逻辑语义体系,使电子病历系统更好地用于循证医学研究与教学中。
  2.4 临床元数据语法结构体系设计
  在语义结构体系基础上建立的语法结构体系是元数据实现计算机化的手段。目前多采用XML语法方案建立语法结构。因为XML语言人机均可读,表达不依赖任何软硬件。
  现有的XML设计方法主要有俄罗斯套娃模式(Russian Doll Design)、意大利腊肠模式(Salami SliceDesign)和软百叶窗模式(Venetian Blind Design)三种模式。
  俄罗斯套娃模式采用的是仅具有一个全局元素(element)的嵌套结构,元素中的所有其他下位级次组件都封装在根元素中,均本地化。俄罗斯套娃模式这种层层嵌套的结构非常简洁紧凑,元素间联系紧密,但致命的缺点是对其他语法方案来说,其中的内容是不透明的,对元素及组件的修改困难,且不可重用。
  而意大利腊肠模式将所有元素及其组件都采用元素声明(element declaration)独立定义,然后通过引用方式进行组合。意大利腊肠模式弥补了俄罗斯套娃模式的缺点,所有的元素及组件都是透明的,对元素及组件的修改变得容易,而且对某一元素的修改能使引用它的元素也相应修改。但意大利腊肠模式不足的是,根据该模式编写的实例内容相对冗长,元素及其组件难以重用,且所有的元素及其组件都是全局化的,命名域都是公开的,不能进行本地化隐藏。
  软百叶窗模式也是先独立定义所有元素及其组件,但与意大利腊肠模式不同的是,软百叶窗模式采用类型定义来定义元素及其组件。这种方式不仅具有前两种方式的优点,而且还可以最大限度地重用元素及其组件,另外还能根据情况将命名域隐藏或公开。
  通过对现有的三种XML设计方法分析不难看出,基于循证医学本体论的临床元数据语法结构模式应采用软百叶窗模式。医学领域中,医学概念、内容、元素是极其庞大的,如仅医学术语编码标准SNOMED就包含35万个基本概念和100多万个关系…。。对元素的重用性能大大提高医学概念、内容、关系的利用效率。软百叶窗模式命名域可灵活、方便地在隐藏或公开间切换,这一特点适用于电子病历系统中临床信息模式的构建。因为不同电子病历系统之间临床数据交换和共享需求不断增加需要命名域的公开,而另一方面,本地电子病历系统中部分信息可能根据情况需要隐藏。
  
  3 结 语
  
  根据元数据标准研究的规律,采用本体论研究方法,从l临床元数据需求分析、语义分析、语法分析三方面探寻基于循证医学本体论的临床元数据的设计思路。特别是临床元数据语义构建过程是元数据建立的核心内容。采用循证医学本体论方法能将在循证医学研究过程涉及到电子病历、临床回顾研究、医学知识库中的临床文献库三个模块中的临床元数据韵概念及其关系进行无歧义表达,建立清晰的逻辑体系,从而实现临床信息的区域性、全国性乃至全球性的共享与利用,为临床实践、临床科研及临床教学等提供最直接的、最真实的证据。

相关热词搜索:本体论 临床 医学 基于循证医学本体论的临床元数据设计方法研究 循证医学主要研究方法 循证医学研究方法分类

版权所有 蒲公英文摘 www.zhaoqt.net