基于共引的专利情报与学术文献对比分析:国内外文献数据库对比分析

发布时间:2020-03-07 来源: 历史回眸 点击:

  [摘要]专利情报和学术文献间既存在着共通性,同时也具有差异性。为了考察两者差别,采用情报方法中的共引分析法分别构建专利情报和学术文献的共引矩阵,进一步聚类成产业公司群和学术团体群;然后将其可视化,以直观的方式将两者进行对比。通过比较,观察到产业集群更为集中,而学术集群略为分散。同时也发现中国公司与国外公司在研究方面存在着较大差距。
  [关键词]共引 可视化专利情报学术文献
  [分类号]G353
  
  在情报研究中,通过分析专利引用或论文引用数据,可以发现相关技术分布,然后,采用统计学的方法对技术进行比较、归纳,可进一步知晓他们之间的相似性或差异性,这种方法已逐渐成为目前常用研究方法之一。在日益受宠的专利地图分析中,包括多个引证指标的引文分析也已成为必不可少的组成部分。而在引文分析中,最具影响力的是共引分析方法。它通过两篇文献同时被后来的一篇或多篇文献所引用的数量情况,利用聚类分析、多维尺度等多元统计分析理论,借助计算机,把众多分析对象之间错综复杂的共引网络关系简化为若干类群之间的关系表示出来,在此基础上分析研究不同学科及文献的结构与特点。因此,其评价更客观、分类更科学、方式更直观。
  
  1 研究背景
  
  共引分析最早出现在学术文献的分析中。1973年,美国情报学家H.G.Small提出共引理论,之后,这方面的研究工作在国外便广泛开展起来,其主要分为两个系列:一是H.G.Small进行的以文章为分析单位所做的共引分析研究;另一是以H.D.White为代表的以作者为分析单位进行的研究。此外,还有部分学者以期刊为分析单位进行研究。国内从上世纪90年代起吸收了国外的共引理论,并对国内文献情况进行了相关分析,如北京大学信息管理系针对中文农业期刊进行共引分析;中国科学院文献情报中心曾对中国科技期刊引文网络的国内外影响力进行分析。
  专利共引研究同样基于H.G.Small的共引理论,国外在20世纪80 90年代就开始呈现出激烈研究态势同,而国内在最近才开始这一热潮。武汉大学于2008年对专利计量的多个指标进行研究,其中采用共引法对有机电激光技术专利进行专利权人的聚类和可视化分析。如今,各种共引分析指标层出不穷,共引分析方法也正不断应用于新的领域中。
  在这些共引分析中,多数只针对于专利情报或学术文献中的一项进行研究,同时涉及两者的研究较少。国外著名引文分析机构CHI研究公司在1998年对美国和欧洲专利中的专利与论文引用关系进行了研究,但其只是讨论了被专利引用的专利与非专利文献,并未涉及公司或研究机构的对比,也未进行共引结果的比较。
  我们针对这一情况,分别对专利情报的专利权人和学术文献的发表研究机构进行共引分析,并以固体氧化物燃料电池(sOFC)为例,对两者结果进行比较,找出产业界公司(专利权人)与学术界研究机构在研究方向上的共通性与差异性。
  
  2 研究方法
  
  由于需要考察专利情报与学术文献两者的关系,所以首先要分别构建两者的共引关系矩阵,并将其可视化,在此基础上进行最后的对比分析。
  
  2.1 专利情报的共引分析
  2.1.1 数据采集数据源是分析的基础,为了全面、严格地进行分析,我们需要选择的是具有世界范围的专利信息,同时需要有较强大引文信息支持的数据库。所以Derwent Innovations Index数据库将是最好的方案。该数据库具有100多个国家的专利信息,并含有10余个国家的专利引文信息,因此最适合进行数据采集。在制订了相应的检索策略后,在此数据库中进行检索,下载数据。
  2.1.2 数据整理在下载的海量数据中,首先要区分每个公司的专利信息,也就是根据专利权人进行统计。现在,不少专利分析软件,如TDA(Thomson Data An山一zer)等已可进行此项工作。根据Derwent公司代码,可统计出每个公司的被引专利量、两个公司的共引专利量,并构建共引矩阵。
  2.1.3 聚类将得到的共引矩阵在统计分析软件SPSS中进行聚类分析(Cluster),并通过多维尺度分析(MDS)将结果可视化。
  
  2.2 学术文献的共引分析
  2.2.1 数据采集众所周知,在学术文献的引文系统中,最权威的就是SCI系统。该系统目前不仅具有期刊类的学术文献,而且集成了会议中的学术文献,其收录范围广、质量高已得到公认。因此,在确定检索策略后,在此数据库中检索,并下载数据。
  2.2.2 数据整理学术文献的引文信息与专利的引文信息不同。学术文献的引文记录中仅有作者信息,不具有研究机构的信息。因此,首先需要将作者与研究机构相关联,即构建作者与研究机构的矩阵,然后,根据此矩阵将被引信息中的作者与研究机构一一对应;最后将每家机构的所有作者被引信息集合、去重,得到最终的研究机构被引情况。之后,构建共引矩阵。
  2.2.3 聚类通过得到的共引矩阵,进行聚类和多维尺度分析。
  
  2.3 比较分析
  将专利聚类和学术文献聚类中的公司(或研究机构)进行比较,发现两者在研究方向上的差异,同时,观察中国的公司(或研究机构)与国外公司(或研究机构)的差距。
  
  3 实例研究与讨论
  
  我们以SOFC为例,按照上述方法,分别进行专利情报聚类与学术文献聚类。
  
  3.1 专利情报聚类
  截止到2008年6月,我们在Derwent InnovationsIndex中共检索到7 057项SOFC相关专利族,通过统计找出被引次数在100次以上的37家高被引公司(专利权人)。
  然后构建这37家公司的37×37共被引矩阵。根据矩阵,在sPss中进行聚类的结果和多维尺度分析。
  虚线(聚类的平均值)可将高被引专利权人划分成三个不同的专利权人集群:西屋电气(A群);三菱重工(B群);其他公司(c群)。
  从群的角度可以看出,唯一的大群(c群)内的各个公司在SOFC的研发方面有着很大的关联性,他们拥有的优质专利基本研究方向相似,很有可能既是竞争者,又是合作者。
  同时,从SOFC专业角度看,由于SOFC技术已趋向于成熟,使得各个公司在研发、产业化的方向趋于一致,这也是造成多家公司形成一个集群的原因之一。而西屋电气与三菱重工分别形成两个孤点群也表明了其在SOFC的研究中有着自己独特的方向和特点,真实地反映出这两家公司在SOFC领域的领先地位。
  多维尺度分析的结果与聚类结果非常吻合,从检验值看,区分度也较好,清晰地将三个群在坐标轴内可视化,从他们间的距离可以更加直观地看出他们之间关系的亲近程度。就如西屋电气和三菱重工两个点距离c群有着明显距离,形成两个孤点,因此形成两个单独的群。
  
  3.2 学术文献聚类   截止到2008年12月,在SCI中,共检索到SOFC相关文献5 330篇。根据前述方法,筛选出论文发表量在40篇以上的研究团体,对其进行共引矩阵的构建。
  根据矩阵,在SPSS中进行聚类的结果和多维尺度分析结果。
  我们按虚线(聚类的平均值)划分不同的研究机构类群,共分为4个群:伦敦大学帝国理工学院(A群);美国能源部西北太平洋国家实验室(B群);德国核研究中心有限公司、丹麦瑞索国家实验室、日本国立材料与化学研究所和日本东北大学(c群)以及其他公司(D群)。
  多维尺度分析的结果也可分为4个群,而且可视化的图形可以更清晰的发现群内关系。如D群中,各个点的距离较近,表示群内研究机构的研究方向更为接近;而c群内各个点相对分散,他们之间的关系比D群内各点的关系略为疏远。
  3.3 产业与学术聚类的比较分析
  3.3.1 产业的集中化学术的分散化通过两个聚类得到的群可以发现,由专利情报得出的SOFC产业集群仅有3个,其中2个群为独立公司,而另一个群则包括了几乎所有重要公司;由学术文献得出的SOFC学术集群为4个,且2个大群内的点比产业大群(产业c群)内的点更分散。因此,对于一项技术而言,在学术阶段,可能呈现出更多的分散趋势;到了产业阶段,则会优选其中的最佳方案,朝着更实用的方向发展,由此呈现出技术集中的特点。
  3.3.2 产业公司与学术机构的两极化在两个集群中,我们未发现一个在学术与产业中都有着较大影响力的团体机构。学术影响力较强的机构基本均为研究机构,在产业影响力较强的机构中多为生产型公司,仅有两家是学术研究机构。这也表明在如今的技术发展过程中,学术研究机构与产业公司还存在着明显的职责和分工差异。学术机构在技术初期进行大量研究,但很难将其直接产业化,只能选择转让或与其他公司合作实现产业化;而生产型公司注重产品的知识产权保护,视申请专利为企业战略之一,因此拥有大量产业化技术专利。但其在初期的理论研发力量较弱,需要借助大专院校等研究机构。
  3.3.3 中国公司的差距在产业集群中,均为国外公司,表明中国公司在研究力上与国外公司有着较明显的差距;而在学术集群中有4家中国的研究机构,但这4个研究机构均在一个集群中,这也表示其研究方向较为一致,不够多样化;同时,也还没有形成自己的特有技术和研究方向。因此,无论中国的公司或研究机构在SOFC领域内都需要进一步借鉴国外公司的先进技术与经验,寻求突破点,谋求发展。
  
  4 结论和改进
  
  通过共引分析及其可视化结果,我们能明确地观察到产业集群(专利情报)和学术集群(学术文献)的状况,由此发现两者在研究方向、政策上的不同;并发现中国的产业团体和学术团体与国外先进者的差距,以供中国机构借鉴。
  在研究过程中,我们也发现了一些问题,比如:学术论文的引文信息中不含机构信息,需要进行作者和机构的核对,但由于作者的同名或跳槽现象,会造成研究机构被引统计的不准确。另外,如在找出集群后,对每个集群的技术特征进行进一步具体分析,可能演变出包含技术特征的机构集群,将会对中国的公司和研究机构有着更明确的技术指引。在今后的研究中,将进一步解决这些问题,以使共引分析的结果更完善,对中国公司的借鉴更具体,在竞争情报工作中起到更大作用。

相关热词搜索:情报 文献 学术 基于共引的专利情报与学术文献对比分析 国内外专利研究的比较分析 情报科学

版权所有 蒲公英文摘 www.zhaoqt.net