信息抽取 基于Heritrix的Web信息抽取

发布时间:2020-03-07 来源: 幽默笑话 点击:

  [摘要]针对现阶段web信息抽取技术的不足,提出一种基于Heritrix的精确抽取方法,由三个分别独立的功能模块共同完成。与一般信息抽取不同,本方法注重于在精确抽取的前提下实现通用化,做到可以根据数据库表的字段来进行最小单位的信息抽取,并且较好地解决信息采集通用性和准确性之间的矛盾。

相关热词搜索:抽取 信息 Heritrix 基于Heritrix的Web信息抽取 基于web的管理系统 基于web的图书管理系统

版权所有 蒲公英文摘 www.zhaoqt.net