多媒体信息检索系统中的用户需求集成|培训需求分析的方法

发布时间:2020-03-10 来源: 感恩亲情 点击:

  [摘要]为更有效地对多媒体信息进行检索,在设计多媒体信息检索系统时人们开始更加注重用户的信息需求。本文设计一种新的检索方法对用户信息需求进行集成,即把用户的信息需求集成到信息检索结果的“语用环境”中。通过使用该方法,可以对多媒体信息检索中的用户需求进行更有效的集成。
  [关键词]多媒体信息检索系统 信息需求 语用环境
  [分类号]G354
  
  1 引言
  
  1.1 国内外多媒体信息检索系统开发现状
  多媒体信息检索包括基于文本的多媒体信息检索和基于内容的多媒体信息检索。目前,在基于文本的多媒体信息检索方面,美国康奈尔大学开发出基于向量空间模型的SMART文本检索系统,美国马萨诸塞大学研究出基于概率模型的INQUERY文本检索系统。在基于内容的多媒体信息检索方面,美国堪萨斯大学开发出数字图书馆系统(DVLS)图像检索系统,该系统计划存储、索引及检索图像、声频信息,已建立起一个VISION的原型系统及一个数据库;马里兰大学开发出Voice Graph音频检索系统,该系统基于内容和基于说话人的查询,检索已知的说话人和语词,并设计音频图示查询接口。
  
  
  
  我国在基于内容的文本检索方面,清华大学的《中国学术期刊(光盘版)》、北大方正的MIRS、易宝北信的TRS全文检索系统都采用了布尔模型。在基于内容的音频检索系统方面,有ARS系统;中国科学院计算技术研究所开发了基于形状的图像检索系统;清华大学研发的TV-FI(Tsinghua Video Find It)系统是视频节目管理系统,提供视频数据入库、基于内容的浏览检索等功能。
  国内外对多媒体信息检索系统的开发研究,无论是基于文本的检索,还是基于内容的检索,其基本思路都是用户以提问的形式表达信息需求,然后系统对提问进行匹配从而在数据库中找出相关信息。如清华大学的《中国学术期刊(光盘版)》,其多媒体信息检索过程如图1所示。
  1.2 存在的问题
  基于文本的多媒体信息检索,其检索纯粹是以多媒体信息的外部特征作为检索入口,无法表达和揭示多媒体信息的实质内容和语义信息;而基于内容的多媒体信息检索,相对于基于文本的多媒体信息检索有着明显的优势,但却存在以下问题:①系统中对象特征相关性、通用性不足。现有大多数基于内容的视频检索系统,要么只针对某一具体领域的应用,要么只针对媒体的某物理特征或基于物理特征的逻辑关系开展研究。系统中各媒体特征之间缺乏内在的关联性描述,使得系统的检索效率不高,通用性不好。②对目标描述的研究相对较少,而且主要针对对象的底层内容检索。虽然有些系统能综合利用媒体的若干特征,但往往局限于媒体特征的外部组合,还没有深入研究各类媒体特征的内在相关性,更没有考虑多媒体对象的高层语义。因此,当用户提交一个检索特征进行查询时,系统很难找到用户真正想要寻找的信息。
  为解决以上问题,本文提出一种新的检索方法,在多媒体信息检索系统中集成用户的信息需求,在进行信息检索前,系统就对用户的信息需求进行集成分析,从而使检索结果更加接近用户真正的需求,系统的查询效果也得到了提高。
  
  2 多媒体信息检索系统中的用户信息需求集成
  
  所谓“多媒体信息检索系统的用户信息需求集成”,是指设计一种新的检索方法,即在信息系统的设计阶段就对用户信息进行描述,把用户的信息需求集成到信息检索结果的“语用环境”中,以达到满足用户需求的目的。通过使用该方法,可以对多媒体信息检索中的用户需求进行更有效的集成。
  
  2.1 设计思路
  2.1.1 设计阶段的用户信息描述1996年,Chevaliet和Nigy提出了信息需求的准确表达,即它是用户研究领域的一种知识。用户信息需求包括对信息客体的需求以及为了满足这一需求而产生的对信息检索工具、系统的需求和对信息服务的需求。
  设计阶段的用户信息描述包括:①用户身份描述(User Identity):姓名、姓氏、地址、职业、职称、学历、研究方向等;②用户信息需求描述(Information Needs ofUser):相当于检索信息的语用环境。
  用户身份的描述主要包括姓名、地址等基本信息的描述,而用户信息需求的描述是通过描述检索结果的“语用环境”完成的,因为通过描述“语用环境”可以确保在系统中有效集成用户的信息需求。
  2.1.2 语用环境所谓语用环境即语境,是“言语行为过程中对话双方运用语言表达思想、交流情感或推导、分析理解话语含义时所依赖的各种因素,包括语言知识和语言外知识两个方面”。
  在用户信息需求提出和接收的过程中,服务人员首先必须具备用户所用语言的知识,包括所用语言的语法、词汇、语音的系统及其规则等,这是理解用户信息需求必须的最基本的语境知识。其次,服务人员必须了解用户表达需求的上下文。因为用户需求的表达和沟通过程必然是一个动态的、不断发展的过程。在这个过程中,新的话语不断产生,每一句话都有可能与前面已经出现的话语存在联系,可能不断完善或表达着用户的需求,为了全面、准确地理解用户的需求,必须了解一段话与上下文的联系。
  下面可以体会一段典型的对话:
  一位读者在图书馆对图书馆员问:“同志,请问《雾》、《雨》、《电》在什么地方?”
  图书馆员回答:“中国文学类,分类号1345.6”,或干脆回答在某个室某个书架上。
  这种对话在日常交际中极容易引起误解,但在图书馆这个特定的场所,图书馆员不会产生歧解,便是因为具体的地点、场合及其相关背景知识起了制约和引导作用。
  因此,在分析用户需求时,必须与当时的地点、场合及其相关背景知识联系起来,必须与用户说话的上下文和用户当时的心情、情绪联系起来,因为这些因素都可能影响用户的信息需求表达。另外,用户的身份、思想、职业、修养、性格等因素,既是决定用户信息需求的客观因素,也决定着用户信息需求的表达,成为用户与服务人员交流和沟通的语境。因此,接收和分析用户的信息需求,必须考虑所有上述因素的影响。
  2.1.3 用户信息需求及其集成模型 考虑到不同类型多媒体内容的存在,假定用户对信息的检索都是基于特定需求的,可以通过信息检索结果的语用环境对用户进行建模。
  考虑到用户信息需求的多样性以及用户信息需求集成后检索结果的精确性与全面性,在设计系统时,可直接通过用户信息描述将多媒体信息检索系统中的用户类型及其信息需求的内容区分出来,构成用户信息需求模型,如图2所示。
  ?对于专业化用户来说,其信息需求内容相对稳定,归纳起来主要有:了解全、新、准的有关科研的前沿问题;科技查新;学习本专业领域的最新学科知识;为提高自己的综合素质而广泛阅读;解决学习中遇到的难题;完成学业论文查询专业信息;了解社会动向等。   ?对于一般网络用户来说,其信息需求主要内容包括以下方面:了解国内外有关新闻和信息;阅读网上文学、期刊、报纸等;寻求新的学习途径、远程教育、出国深造;学习因特网技术;了解人才市场信息;应用BBS或虚拟社区进行聊天或问题探讨;发送邮件贺卡;网上娱乐等。
  如今,由于社会的不断发展,用户的信息需求已趋向于社会化、实用化、浓缩化、个性化。因此,在设计多媒体信息检索系统时,一定要铭记用户的信息需求,以便更有效地对用户的信息需求进行集成;同时在信息系统创建和反馈过程中更精确地集成结果信息的使用语境,加强更有针对性的用户需求。
  通过上述分析,笔者设计的多媒体信息检索系统中的用户信息需求集成模型如图3所示。
  从图3可以看出,信息需求被集成到系统中是通过与用户和语用环境相关的属性来完成的。这些属性可被提前定义或由用户在检索信息的过程中进行添加。在该应用过程中,定义出信息检索的四个语用环境:培训(training)、教学(teaching)、娱乐(entertain-ment)、内容(documcntation)。但需要明确的是,这四个语用环境都是信息检索过程中最常用到的,实际中并不能预测出所有信息检索的可能语境,当然也可能是用户找不到与他相关的语境。为了弥补这种语境“缺失”的问题,可以建立一种开放式模式来描述多媒体信息。该模式即使是在信息系统开发之后还允许用户描述其新的语用环境,也就是通过标识处理用户可以详细说明他们的新语境。这种详细说明是通过语用环境的属性重组表达出来的。此后,不管用户的信息需求是否相同,这种已被描述的检索信息语用环境都可被各种用户使用。该语用环境的使用可被看作是一种协作式信息检索。依照这种思路在设计多媒体信息检索系统时可建立流程图,该流程图描述了多媒体信息库与用户之间的关系,如图4所示。
  
  2.2 实例分析――QBIC系统中的用户需求集成QBIC(Query By Image Content)是IBM Almaden研究中心研制的,是第一个真正的功能齐全的CBR(基于案例的推理)系统,它用到的检索特征包括颜色、形状、纹理、对象形状等,这些特征一般采用半自动的方法抽取出来,系统通过范例、用户描绘的草图、选择的颜色和纹理图案、摄像机移动、组成物体运动情况等方式来进行数据库查询。QBIC系统的查询步骤如下:用户提出查询要求,系统按查询要求将一系列结果按相似顺序排出。查询要求通过图形化或示例的方式提出,而结果是按相似程度顺序排列的图像集合。为完成这一功能,QBIC主要由两个部分组成:数据库生成部分和数据库查询部分。在数据库生成时,每一个图像对象和视频对象的内容特征,包括颜色、纹理、形状及摄影机和对象的移动等,都被数据库生成部分提取出来并存人数据库中。在数据库查询时,数据库查询部分将把用户用图形化方法提供的对象特征,与数据库中存储的对象内容特征进行比较匹配,寻找出具有相似特征的图像和视频。在QBIC中其数据模型分成两个层次:场景(或图像)和对象。所谓场景就是一幅图像或视颇中的单个代表帧。对象是场景的一部分,或者是视频中的一个运动的实体。特征将从图像和对象中提取出来,并存人数据库中。QBIC查询结构图见图5。
  在QBIC系统中进行用户需求集成,首先要在设计阶段进行用户信息描述,即用户身份描述和用户信息需求描述;然后是用户信息需求建模(见图2);最后是设计QBIC系统中的用户信息需求集成模型,如图6所示。
  设计阶段对用户信息的描述,使最终的匹配结果也将根据用户的不同而不同,最终检索系统将更有针对性地反馈给不同的用户。这样不仅提高了检索的效率,同时也提高了检索的准确度。3结语
  本文的研究目的是对多媒体信息检索系统中的用户需求进行集成。该系统的使用用户是定向的而且它也可以根据用户的语用环境进行恰当的调整。此外,本文提出将用户信息需求集成到信息检索结果的“语用环境”中,这种方法不仅可以确保用户和系统之间的有效互动,而且使多媒体信息系统更有助于用户对检索信息及其语用环境进行描述。

相关热词搜索:多媒体信息 需求 集成 多媒体信息检索系统中的用户需求集成 多媒体信息集成软件 多媒体信息集成工具

版权所有 蒲公英文摘 www.zhaoqt.net