[基于本体论的高校图书馆个性化书目推送系统]推送

发布时间:2020-03-07 来源: 散文精选 点击:

  [摘要]针对高校图书馆个性化服务的要求,研究利用本体论技术实现高校图书馆个性化的书目信息推送服务。对书目信息本体论、用户信息本体论和用户兴趣模型的构建进行介绍,并在此基础上构建一种基于本体论的高校图书馆个性化书目信息推送系统模型,该模型不但可以为每本书找到它们潜在的读者,还可以为读者节省时间,使读者不用到图书馆就可以获取所需书目信息,为高校图书馆实现个性化书目信息推送服务提供参考。
  [关键词]本体论 个性化服务 书目推送 高校图书馆
  [分类号]G250
  
  随着信息化时代的到来,人们对信息的实效性要求越来越高,高校图书馆如何不断地改进服务质量,更好地服务广大师生已成为一个紧迫课题。而如何及时主动地为广大师生提供个性化书目推送服务正是其中的要求之一。主动推送的书目信息必须符合用户需求,需要根据用户对馆藏书目检索和图书馆网络的使用情况,收集用户行为数据进行分析,从而挖掘出用户的潜在需求,再相对应地制定推送策略,为广大师生提供个性化的书目信息推送服务。这种个性化的书目推送服务,体现了阮冈纳赞提出的“图书馆五法则”中“每本书有其读者”,“节省读者的时间”这两条原则。
  目前,针对本体论的研究是图书情报领域的研究热点,无论是领域本体论的构建还是个性化信息服务中基于本体论的用户兴趣模型的构建,都有很多研究成果报道,而关于书目信息推送服务,虽然也有较多的研究成果,如利用RSS信息聚合技术来实现图书信息推送服务,利用邮件及手机短信进行书目信息推送服务等,但利用本体论技术进行个性化书目信息推送服务的研究,还鲜有相关报道。本体论作为一种新的知识表示方式,由于具有良好的概念层次结构和对逻辑推理的支持,因而在实现个性化的书目信息推送服务中具有很好的应用前景。本文拟对此进行相关研究,为高校图书馆实现个性化书目信息推送服务提供参考。
  
  1、高校图书馆个性化书目信息推送服务
  
  高校图书馆个性化信息服务,是指针对不同的用户(学生或教师),根据其个人信息,采取不同的服务策略,提供不同的服务内容来满足其对信息的不同需求。开展个性化的书目信息推送服务,就是在个性化书目信息推送系统的环境下,根据用户的特征提供用户需要的具有针对性的信息,同时通过对用户专业特征、研究兴趣的智能分析而主动地向用户推荐其可能需要的书目信息,以满足用户信息需求多元化的需要,提高图书馆的服务质量和服务层次。
  高校图书馆提供的个性化书目信息推送服务有其自身的特点:①服务对象明确、层次分明。高校图书馆主要服务对象是高校的教学科研人员、行政管理人员和学生,就每类服务对象而言,又可再进行细分。比如:教师可分为教授、副教授、讲师、助教等,学生可分为博士研究生、硕士研究生、本科生等,这就要求高校图书馆根据各类对象对信息资源需求的侧重点不同而提供个性化书目信息推送服务。②服务对象知识化突出、专业化明显。高校师生是高校图书馆的主要服务对象,他们具有较高的文化水平,对专业知识的掌握比较深入,因而对信息服务的质量要求比较高,对书目信息的需求主要集中在相关专业及邻近专业上。因此,必须针对不同服务对象的不同特点提供书目信息推送,才能充分发挥个性化书目信息推送服务的重要作用。
  
  2、书目信息及用户信息本体论库
  
  为了实现基于本体论的个性化书目信息推送服务,建立一个能全面准确表达书目资源信息以及用户信息的本体论库是关键所在。该本体论库不但能全面准确地描绘出书目资源以及用户特征的标志信息,而且可以清晰地建立起书目资源之间、用户之间以及书目资源与用户之间的各种联系,这也正是基于本体论的个性化书目信息推送系统的优势所在。本体库设计如图1所示:
  从图1可知,本体论库中至少要包括书目信息资源类、读者特征类和知识库类等3个类目。书目信息资源类的属性包括资源的标题、作者、相关知识以及相关读者等,其中相关知识的属性值域指向知识库类,可以建立起书目资源实例与知识库中特定知识领域实例的隶属关系;相关读者属性值域为读者特征类,可以建立起特定资源与该资源的目标读者之间的关联。读者特征类的属性包括读者类型、专业方向、学位学历、兴趣爱好以及关联读者,其中专业属性与兴趣属性,其值域指向知识库类的实例,以建立起用户与知识库领域实体的一对一或一对多关系。知识库类则以某个知识领域通用的概念为描述对象,建立并描述这些概念之间的关系。
  
  3、基于本体论的用户兴趣模型
  
  基于本体论的用户兴趣模型可以借助于书目信息本体论以及用户的个人信息资料来构建,其中的每一个概念都被赋予一个初始值为0的概念兴趣相关度。随着用户检索图书馆书目系统以及办理借阅次数的不断增加,通过对用户兴趣相关领域概念的提取以及对概念兴趣相关度的计算,不断在用户兴趣模型中累加此概念的兴趣相关度权重,这样经过一段时间,用户兴趣模型中概念兴趣相关度非零的概念节点逐渐趋于稳定,即用户兴趣模型逐渐收敛。其中概念兴趣相关度权重越高的概念表明其与用户的兴趣越相关。
  3.1 用户兴趣的获取
  目前各个图书馆的流通管理系统数据库中都积累了大量的读者借阅历史数据以及读者在办理借书证时留下的大量个人信息资料,利用这些信息我们可以挖掘出用户对图书资源的借阅偏好模式以及用户潜在的需求,获取用户的兴趣所在。
  ?根据用户个人信息进行聚类。虽然每个用户都有其个性化需求,但是在一定条件下,他们的需求会有相似性,因此可以收集用户公开的所有个人信息,将相同属性的用户聚类。例如:相同专业年级的学生对某些课程科目的信息需求是类似的,在馆藏书目系统中,他们也许就使用过同一个主题词进行检索。同一属性类的用户中,某一用户感兴趣的书目,另一用户也有可能感兴趣。
  ?根据用户检索数据进行分析。用户在使用书目查询系统时输入的检索记录,反映了用户感兴趣的书目信息,我们可以通过分析用户输入的检索词,包括题名、责任者、主题词以及分类号等,来获取用户的兴趣概念;在这个过程中,对于用户输入的责任者、主题词等检索项,可以直接提取作为用户的兴趣概念;对于用户输入的题名,则要先通过分词等技术抽取出能代表该书目内容的特征词语,然后把这些特征词语与领域本体论中的概念进行匹配,实现从特征词语到概念词语的转换,从而获取用户的兴趣概念;对于用户输入的分类号,要先把分类号转换成相应的类目概念作为用户兴趣概念。
  ?根据用户访问日志进行挖掘。图书馆网站的Web服务器积累了大量的用户访问数据,这些数据是用户真实意图和动机在行为上的表现。通过Web日志文件,我们可以获取用户的访问页面以及用户在每页停留的时间等数据。对这些数据进行分析,用户浏览页面上可能含有用户所寻找的信息,进一步挖掘用户的隐性需求。
  3.2 概念兴趣相关度的获取   影响用户的概念兴趣相关度的主要因素有:①用户借阅某本书的时间Length。对于某本书,用户借阅时间越长,则表明用户对该书兴趣越大;②用户借阅或检索某本书距离现在的时间PassedTime。很明显,用户很久以前借阅的某本书和刚刚借阅的相比,后者用户更感兴趣;③用户的直接反馈Evaluation。用户对推送书目的评价最能反映用户对该书的兴趣程度。
  考虑以上几个因素,用户借阅或检索某本书后,对该书所对应概念的兴趣度变化AI,可以参考如下的计算公式:
  △I=W1*f1(Time,Length)+W2*f2(PasssedT-ime)+W3*f3(Evaluation)
  (1)
  其中,f1、f2、f3为三个函数,分别用于计算上述三个因素对该书目对应概念的兴趣相关度的影响。w1、w2、w3分别为这三个因素在影响概念的兴趣相关度变化量中所占的权重。
  
  4、一种基于本体论的书目信息推送系统模型
  
  该模型主要由以下几个部分组成:用户界面代理、书目信息推送模块、本体论服务器(包括用户兴趣模型、书目信息本体论库)、书目信息分析模块、书目信息数据库、个性化书目信息索引库等。
  4.1 用户界面代理
  用户界面代理在系统中的主要作用表现为:
  ?建立用户个人档案。当用户首次登录时,用户界面代理要求用户通过注册建立起自己的个人档案,内容涉及用户身份、知识背景、兴趣领域等方面的内容。用户档案的建立可以使系统构建初始的用户兴趣模型。
  ?选择推送模式。主页推送、邮件推送或手机短信方式。
  ?对用户行为进行动态监测。对用户行为的动态监测可以包括:用户借阅某本书的时间、用户借阅或检索某本书距离现在的时间、用户对推荐书目的评价等。用户界面代理通过以上对用户行为的监测分析,将结果反馈到用户偏好本体论库中,使用户的下一次查询能够得到更优化的结果。
  ?获取用户反馈信息。用户界面代理建立了用户对推送书目信息的评价机制,鼓励用户对推送书目信息给出量化的评价值,该值通过某种计算后,用于更新用户兴趣模型的内容,并据此对个性化书目信息索引库中的内容进行调整。
  4.2 书目信息本体论库
  书目信息本体论库在系统中的作用主要包括:
  ?利用书目信息本体论对书目信息进行语义标引。对于书目信息库中的每一条信息,书目信息分析模块首先提取其中的特征词,然后可以在书目信息本体论的协助下,将其转换为本体论中的概念词,并与具体的每一条书目信息建立映射关系,从而实现对书目信息的语义标引。
  ?利用书目信息本体论构建用户兴趣模型。利用本体论库构建的用户兴趣模型,不仅包含了用户的兴趣概念,还包含了用户兴趣概念之间的各种关联,这样系统可以在用户兴趣概念之间进行推理,挖掘出用户潜在的兴趣概念。另外,当用户对某一兴趣概念的概念兴趣相关度发生变化时,系统可以对与其相关联的兴趣概念的概念兴趣相关度做出相应的调整,从而使用户的兴趣模型更准确地反映用户的实际情况。
  4.3 用户兴趣模型
  在使用推荐系统时,比较突出的一个问题是客户信息的获取,然而在本系统中,由于高校图书馆书目推荐系统用户和使用环境的特殊性,系统可以方便地得到较为真实的用户偏好、个人信息等,使这一问题得到较好地解决。读者信息主要包括:①读者的基本个人信息,如所在院系、身份信息(教师还是学生)、职称信息、学生类别等。这些信息不需要读者自己输入,可以从学校管理信息系统获得;②读者的显/隐性输入信息,如读者输入关键字、书名、文献特征、读者的浏览记录等;③读者的历史借阅记录数据;④读者借阅过某些文献所给出的评价。
  由于用户的兴趣知识属于一种隐性知识和动态知识,很难对其进行直接或明确的说明,因此用户偏好本体论库的构建也不可能是一劳永逸的,而是要通过系统对用户兴趣的动态追踪,不断深入挖掘,并在此基础上对用户兴趣模型的内容进行不断修正,才能比较准确地反映用户的兴趣偏好。
  4.4 书目信息推送模块
  书目信息推送可以基于以下三种方法:
  ?基于相关性书目信息的推送:推送系统根据用户感兴趣的书目信息来推送其它相关的书目信息,这种方式需要了解客户当前选择的书目信息。例如某位读者选择借阅了有关“电子商务”的书籍,推送系统就可以向其推荐其它关于“电子商务”图书的书目信息。
  ?基于相关性用户的推送:推送系统根据目前用户与其他已经借阅了某图书的其他用户之间的相关性进行推送。例如推送系统可以对某计算机学院的读者推送与其相类似(相同爱好、研究方向等)的其他读者借阅查看的资料。
  ?基于用户专业及兴趣的推送:推送系统可以根据某读者的历史借阅数据以及用户的专业、研究方向等,获得读者潜在知识需求,对读者进行书目信息推送。
  推送的形式可以根据用户的不同情况,由用户选择以下三种方式中的一种:
  ?用户登陆图书馆网站查询时自动弹出推送书目信息。
  ?通过E-mail发送到用户邮箱。
  ?通过短信发送到用户的手机。
  由于本体论具有良好的逻辑推理功能,因此,书目信息推送模块能够借助本体论从语义层面根据读者特征信息、资源特征信息和知识库信息,自动推理出与读者所从事专业、阅读兴趣等相匹配的书目信息资源。针对高校的特点,每个读者的特征类包含了关联读者属性,通过该属性,可在老师与学生之间、具有相同爱好读者之间建立联系,将资源信息推送给目标读者的同时推送给关联读者,实现点对面的资源推送。
  4.5 书目信息分析模块
  书目信息分析模块的功能主要是对书目信息进行语义概念层次上的分析与过滤,只保留下与用户相关的书目信息、过滤掉无关的。具体来说:①书目信息分析模块需要对所收集到的每一条书目信息进行特征词的抽取;②对于抽取的这些特征词,书目信息分析模块还需要在书目信息本体论的协助下,将其转换为本体论中的概念词语;③还要把含有这些转换为本体论中的概念词语与用户兴趣模型中的概念词进行匹配,只有匹配成功的概念词语所对应的书目信息资源才是需要保留的。将这些保留下来的书目信息按照某种规则排序后存入个性化书目信息索引库中,由书目信息推送模块按照某种方式推送给用户。
  4.6 个性化书目信息索引库
  系统自动为每个图书馆的用户建立个性化书目信息索引库,即从书目信息库中抽取出与用户相关的书目信息实体,滤出无关信息,满足了用户个性化书目信息需求。
  个性化书目索引库中的书目信息是按照用户兴趣概念进行存储的,每个兴趣概念都与用户兴趣模型中的概念相对应。当用户兴趣模型中的用户兴趣发生变化时,个性化书目信息索引库相应地也会做出调整。在这里,我们假定个性化信息索引库中包含有一个对自身信息进行管理的管理服务器,管理服务器会把不符合用户兴趣的兴趣概念及其相应的书目信息从个性化书目索引库中删去,同时加进用户新产生的兴趣概念等。
  
  5、结论与展望
  
  基于本体论的个性化书目信息推送系统不但可以为每本书找到它们潜在的读者,还可以为读者节省时间,使读者不用到图书馆就可获取所需的书目信息。我们相信,随着信息化、网络化、数字化的进一步推进,基于本体论的个性化书目信息推送系统在高校图书馆将得到广泛的重视和应用,为读者提供更人性化、个性化、智能化的书目信息推送服务,为其节约大量时间和精力,使高校数字图书馆的服务更令人满意,使其资源得到更充分的利用。

相关热词搜索:本体论 推送 书目 基于本体论的高校图书馆个性化书目推送系统 个性化推荐系统项目 个性化推荐系统代码

版权所有 蒲公英文摘 www.zhaoqt.net