政务服务信息技术岗位做什么 [论新信息技术对政务革新的作用]

发布时间:2020-02-16 来源: 短文摘抄 点击:

  摘要:信息技术越来越多地应用于社会多种领域,政务处理当然也不例外。本文讨论了政务处理方法的历程,重点突出了新的信息技术对政务的革新作用。最后以检察院为例提出具体应用数据仓库和数据挖掘技术的有效方法,辅助政府获得潜在的知识信息。
  关键词:信息技术;数据仓库;数据挖掘;政务
  中图分类号:TP399 文献标识码:A
  
  在信息时代,信息技术的快速发展对社会各个领域都产生了一定的影响,在电子商务中反映尤为突出。电子政务的出现相对较晚,但据国外学者研究表明大约80%以上的重要信息资源掌握在政府手中,所以许多国家都将电子政务作为本国在信息技术应用领域的首要任务。
  
  1 政务状况分析
  
  政府不仅是处理人民群众日常事务的单位,它更重要的作用体现在可以反映群众的多数意见和分析社会大范围的特征,并以此帮助人民群众和社会向更好的方向发展。政府对这些事务的处理到目前为止经历了人工和计算机处理的两大阶段。
  (一)人工处理阶段
  为了反映较大范围人民群众的整体特征,政府经常要付出庞大的人力和物力收集大量数据。这个数据的收集通常要经历一个较长的时间,间隔一段时间还必须重复执行。比如犯罪规律调查、经济普查、群众意向调查等。然而,分析收集来的海量数据更是政府头疼的一件事。
  还没有出现计算机前,光靠人工来处理数据有时还会面临这样的窘境:上一期的数据结果还没分析出来,下一期的数据收集又要开始了,因此整个数据收集和分析工作变得没有任何意义。另外,有些数据需要间隔一段时间重新收集,然后分析短期和长期的数据。比如经济普查,若政府制定每5年一次经济普查,则每5年政府就可以做一次短期经济状况分析。但是政府不仅只要知道近5年来的经济状况,还需知道近10年、近20年、50年甚至更长时间的经济发展状况,那么光靠人工去翻阅以前的数据就是件很困难的工作了。所以人工处理数据阶段,有许多政务受到很大的限制。
  (二)计算机处理阶段
  自计算机出现后,许多领域的工作发生了翻天覆地的变化,政务处理同样也不会忽略如此有效的手段。随着计算机在各政府部分的使用,逐渐出现了“电子政务(Electronic Government,即EG)”。20世纪80年代以来,我国一直关注电子政务,2001年电子政务被列入国家“十五”发展规划。电子政务的发展大致经历了以下三个阶段:面向数据处理的第一代电子政务、面向信息处理的第二代电子政务、面向知识处理的第三代电子政务。在前两个阶段中,许多政务工作确实提高了效率,但是政府海量数据中隐含的价值仍不能被有效发掘。正如在一大座金山中,获取更有价值的黄金还需更细致更有效的清理和挖掘。
  虽然在前些年,各级政府部门具备了一定的信息化基础设施,为构建电子政务系统奠定了基础。但是,由于缺乏统一的规划,各政务系统成了一个个“信息孤岛”,也没有有效的方法从海量数据资源中快速挖掘有价值的知识信息。因此,耗费成本收集的数据没有利用就被弃置了,政府也不能够发挥出更多潜在的社会价值。
  由于信息技术的发展,电子政务逐渐进入第三代发展中,即有效应用数据仓库和数据挖掘技术挖掘知识。
  
  2 DW和DM技术
  
  数据仓库(DataWare,即DW)是指一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策[1]。当大量的数据被整合在一起后,从用户分析角度来看,使用这些数据的手段是多方面和多层次的。面向知识处理的EG系统应能够自动剔除掉不需要的数据,按照用户的要求整合杂乱的数据资源,获取某些可用的属性。而且,政府的决策通常是经过观察长期社会发展的状况而制定的。这其间,需要分析5年、10年,甚至几十年的大量相关数据资源。因此,政府数据需要被长期、且稳定的存储。在日常收集数据和整理数据时,利用数据仓库的思想来进行有利于我们充分发挥数据挖掘技术进行知识的挖掘。
  数据挖掘(Data Mining,即DM)是指从大量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程。数据挖掘就是从大量数据中提取或“挖掘”知识。
  首先,我们要确定数据挖掘的对象有哪些。数据资源可以从多种方面获得,如系统分析设计人员向不同范围的业务对象调研获得,或反之业务对象主动向系统设计人员提出;在互联网时代,从网络中获得数据资源更快更多了。
  其次,要有效地应用数据挖掘技术,就要遵循科学的应用流程。一般的挖掘流程是:(1)确定挖掘对象;(2)数据准备;(3)数据挖掘,即模式提取;(4)结果分析,即模式评估。[2]
  数据挖掘功能用于指定数据挖掘任务中要找的模式类型。数据挖掘任务一般可以分为两类:描述和预测。描述性挖掘任务刻画数据库中数据的一般特性。预测性挖掘任务在当前数据上进行推断,以进行预测。数据挖掘系统要能够挖掘多种类型的模式,以适应不同的用户需求或不同的应用。数据挖掘功能以及它们可以发现的模式类型包括:class/concept description、Association analysis、Classification and prediction、Clustering、Outlier analysis等。
  
  3 建立面向知识处理的政务系统
  
  按照上述数据挖掘的基本流程,以检察院为例介绍如何让EG系统真正实现面向知识的处理。
  (一)构建EG系统的数据仓库
  这部分主要分为四个任务:确定检察院EG系统中的数据源;Web日志数据的预处理;多维Web数据模式的建立;应用OLAP技术。
  1.确定检察院EG系统中的数据源
  检察院EG系统的数据主要从两个方面获得:
  (1)调研和用户主动提供的数据资源;
  (2)EG系统从其门户网站中获得数据源。
  在原来的检察院系统中,大量数据资源主要从第一方面获得。当实施了EG后,政府将从其门户网站中获取更多、更丰富的数据资源。因为检察院对第一种数据来源已形成了较成熟的数据库,只需直接导入数据仓库。那么如何对庞大的Web日志数据建立数据仓库呢?
  2.Web日志数据的预处理
  Web服务器日志文件中的数据称之为原始数据,管理员可根据需要用某些日志字段记录相关数据。[3]如:用户的域名或IP地址,用户的Login ID,访问日期和时间,访问的方法,被访问页的文件名和参数等。对Web日志数据的预处理包括两步。第一步:清除噪音,即去掉对知识挖掘无关的数据。第二步:转化数据,即将原始数据按照挖掘需求通过重新组织或简单计算转换成规范模式。
  3.多维Web数据模式的建立
  分为三步进行。第一步,选取维。多维数据便于我们从多个角度、多个侧面对数据库中的数据进行观察、分析,以深入了解包含在数据中的信息和内涵。N维数据矩阵用C(A1, A2,……, Am ,count)模式表示,其中A??i代表第i维,i=1,2,……,n, count是变量,反映数据的实际意义。
  数据单元用r[A1:a1,……,An:an,count]模式表示,即为维Ai选定一个维成员a??i,i=l,…,n,这些维成员的组合唯一确定了变量count的一个值。通常,需要了解用户对门户网站中文件资源的访问行为,可以选取用户维、时间维、文件维构建数据矩阵,以形成多维视图。
  第二步,构造检察院门户网站访问数据的多维视图。先选取data维(按季度组织)、file维(按文件类型组织)用2-D形式表示用户对检察院门户网站的访问行为。然后加入第三维location(按用户所在区组织),进一步构建用户访问行为的三维视图。视图显示的事实是visit_count(访问次数)。
  第三步,创建多维数据模式。最流行的数据仓库数据模型是多维数据模型。最常见的模型范例是星型模式。
  
  4.应用OLAP技术
  
  OLAP,即在线联机处理。应用OLAP技术可以很方便地从Web日志数据矩阵中作出一些简单的结论性分析,如回答一些问题:(1)哪些资源访问情况最好,哪些最差?(2)用户的地域分布情况如何?我们可以充分利用多维数据模型上的OLAP操作,如下钻(drill-down)、上卷(roll-up)、切片分析(slice)和切块分析(dice)等技术对问题进行求解。
  (二)挖掘模式的有效应用
   应用数据挖掘技术可以自动发现用户的行为特征和系统的访问模式。
  1.数据挖掘技术应用的范围
  虽然现在已有很多地方级政府部门都建立了自己的门户网站,但公众只能在这些网站上浏览少量的政府职能和部门介绍。这样的政府门户网站没有根本上体现本身应有的应用价值。检察院构建其门户网站,需要向公众、企业和其他政府部门提供尽可能多相关信息和服务。同时,检察院通过门户网站也要有能力获悉访问用户的访问行为和动机、趋势。在服务器以及浏览器日志记录的数据中隐藏着模式信息,结合网络技术应用数据挖掘技术可以自动发现系统的访问模式和用户的行为特征,从而进行预测分析。
  2.应用挖掘模式提取和分析知识
  根据不同的应用要求,在数据挖掘模式中选择合适的方法进行计算,提取有效数据,得出知识。对于检察院,可以应用聚类方法确定特定用户的地域分布,从而识别出一些问题:
  (1)哪些分区在一段时间内网上举报情况较集中。
  (2)网上举报较集中的地区是因为案件发生频繁,还是因为网络普及范围广。
  (3)对比网上举报和非网上举报的用户群,以辅助政府决策对不同地区采取不同的情报收集手段。
  关于新的信息技术对政务处理的革新作用,还有许多值得继续深入研究的。但是,不论从那个方向进行研究,都必须要以提高政务处理能力为宗旨,将先进的信息技术有效的应用于政务处理上,让政府资源发挥最大的社会价值。
  
  参考文献
   [1]Colin White. Data Warehousing. Cleaning and Transforming Data [M]. InfoDB,2002.
  [2]林宇.数据仓库原理与实践[M]. 北京: 人民邮电出版社,2003.
  [3]杜国宁, 朱仲英. 基于Web技术的数据挖掘系统研究与设计[J]. 微型电脑应用,2005, (1).

相关热词搜索:革新 信息技术 政务 论新信息技术对政务革新的作用 政务信息的作用 什么是政务信息工作

版权所有 蒲公英文摘 www.zhaoqt.net