[信息化测评可视化研究]数据可视化测评原则

发布时间:2020-03-07 来源: 历史回眸 点击:

  [摘 要]用信息可视化方法对信息化测评进行研究。根据信息可视化流程,利用C#.NET开发工具,开发出信息化测评可视化系统。对此系统的特点进行说明,给出系统开发的关键步骤。指出如何利用此系统发现信息以及这些信息对政府信息化问题决策制定的影响。
  [关键词]信息可视化 信息可视化流程 平行坐标系 信息化测评 多维信息
  [分类号]G350.7
  
  可视化的目的是洞察数据,发现信息、做出决策或解释数据,本文用信息可视化方法,对信息化测评进行了研究,这是研究信息化测评的新视角。根据信息可视化流程,笔者利用C#.NET开发工具,开发出了信息化测评可视化系统。
  
  1 信息可视化流程
  
  信息可视化流程是将信息转换为能够与用户交互的可视形式的计算过程。具体步骤,如图1所示。图1给出的流程模式是文献中给出的流程模式的改进,虽然文献中的流程模式流传较广,在我国学术界也有介绍,笔者更欣赏文献中的模式图1。
  下面对图1中的步骤做一些说明:
  第1步,将原始信息转换为组织良好的规范的数据形式,这种形式通常构成包含数据实体的数据集,每个数据实体具有多个属性值。根据需要,各种数据处理步骤(如:数据挖掘)可用于处理数据,导出数据往往对于洞察结果有帮助。
  第2步,将数据集映射为可视形式,是可视化过程的主要步骤,可视形式包含对应于数据集实体的标记(glyphs)。
  第3步,将可视形式嵌入到视图,视图显示在屏幕上,并提供各种视图变换,如:导航。视图通过人的视觉系统呈现给用户。
  第4步,用户能够与上述任何一步进行交互,以改变可视化结果并做进一步解释。
  上述第2步中的可视映射是可视化的核心,应小心设计。此映射的作用是人机通讯,通讯的媒介是信息的可视表示。通过某函数F,数据集被映射为可视形式,此函数将数据集作为输入,将可视表示作为输出。当可视表示传递给用户时,他们必须能从认知上对可视映射求逆,以从可视表示解码信息。
  
  
  2 信息化指标体系
  
  中国信息化指标体系由国家信息化测评中心发布,这套指标体系设置了6个大类,共25个指标。该体系主要用于国家信息化发展水平地区间横向比较,并在此基础上拓展到纵向比较。指标的数据绝大部分在现有的统计数据中可以获得,个别没有的,做特定调查也比较容易获得,基本上可以反映一个国家、地区或部门的信息化水平与发展态势。具体指标如表1所示:
  
  
  3 信息化测评可视化
  
  信息化指标原始信息是25维,由于缺少4维数据,可认为是21维,我们采用多维信息可视化的平行坐标系法,对其进行可视化研究。
  
  3.1平行坐标系法
  平行坐标系法是多维信息可视化的有效方法,此方法将多维信息,映射到二维平面,且没有信息丢失。
  笛卡儿坐标系使用垂直坐标轴表示2维与3维数据,垂直坐标轴表示的维数有限,对多维信息的表示基本无能为力,因此,人们想到使用平行坐标系来对多维信息进行可视化。平行坐标系中的坐标轴是平面上的一组平行的竖直直线,多维信息可表示为该坐标系中的一条折线,折线连接了多维信息各分量在各自坐标轴上的对应点。使用平行坐标系进行可视化没有信息丢失,并有下面的性质:
  ?表示复杂度低。由于坐标轴的个数N等于维数,复杂度为O(N)。
  ?对于N没有限制。
  ?每个分量被平等对待。
  ?展示的对象在射影变换(比如:旋转、平移、缩放、透视)下能够被识别。
  ?图中的特征可以容易地/直观地被转换为其代表的N维对象的特征信息。
  ?平行坐标系法基于严格的数学与算法结果。
  平行坐标系将多维信息关系转变为2D模式,这很适用于可视数据挖掘。
  
  3.2信息化测评可视化系统
  在国家信息化测评中心的官方网站上,能找到中国各地区信息化指标原始数据。在这些数据中1998年的数据最完整,本文正是用1998年的数据进行可视化研究的。笔者根据信息可视化流程,使用C#.NET开发工具,开发出了信息化测评可视化系统。
  国家信息化测评中心公布的1998年信息化指标原始数据是Excel格式,为了更好地进行可视化研究,也为了数据管理的方便,首先将这些数据转换成了Access数据库格式,这就是本系统的数据集。数据集中的数据实体是某年、某地区的信息化指标,选定的数据实体对应平行坐标系中的一条折线(标记),折线连接了信息各分量在各自坐标轴上的对应点,这就是流程中的可视映射F。
  图2是1998年全部数据的对应结果,图中竖线共21条,是平行坐标系的坐标轴,它们与信息化指标相对应。坐标轴两端的数字是对应指标的最大值(上端)与最小值(下端),它们是由系统动态生成的,即通过程序比较数据集的各维数据得到。坐标轴下方有各坐标轴的名字,就是其对应的信息化指标。由于各个指标的值均非负,各个坐标轴上的坐标值从o开始,在其最下方。
  图中的坐标系与全部折线是流程中的可视形式,整个图是流程中的视图。用户可多方位与系统交互,下面做一些介绍:
  ?可以添加、修改数据集中的数据。比如:增加其它年份的数据。
  ?可以对数据集中的数据进行选择。系统提供以下选择方式:①对每个维(x1-x25、年份)可以进行范围限定,在图2的左下方有一个组合框,可在其中选择一个参数(x1x25、年份),然后在随后的两个文本框中给出此参数的范围。选出的数据可以指定显示颜色(缺省为蓝色),选出的数据将
  
  
  4 信息发现
  
  通过对图2的观察,可以对各个指标分量数据的分布情况有一个整体的把握,比如:x1与x25在其范围内分布较均匀;x13除少数几个外,大部分数据集中在一起,并取较小的值。我们可以重点观察这些集中在一起的数据,限定x13的范围为2到11可以得到这组数据的可视化结果(见图3)。从图3可以看出当x13较小时,x12与x3的值也较小并聚集在一起。这说明x13、x12及x3之间也许有一定的联系,有可能是因果关系。这些地区要提高信息化水平,应该重点关注x13、x12Nx3的提高。其中x1~x25的含义见表1。
  可以将某地区的信息重点显示,以与其它数据进行对比。比如,将北京地区的信息重点显示得到图4,图中较宽的折线对应北京(考虑到是黑白印刷,没有使用其他颜色)。从图4可以看出北京的信息化水平较高,除x1,x7,x8,x25外,其它指标均名列前茅,许多指标遥遥领先。北京地区要进一步提高信息化水平,工作的重点可以从提高x1,x7,x8,x25入手。
  
  5 结 语
  
  本文详细探讨了信息测评可视化系统的建立,可视化是研究信息化测评的全新手段。从上面的探讨我们知道,通过可视化可以清楚地把握信息化测评数据,能够比较容易地发现数据中隐含的规律,这正是信息可视化的作用。对本系统进行更加细致的使用,还可以发现更多隐含在信息化测评信息中的规律,得出更多结论。可以进一步完善本信息化测评可视化系统,进而获得更多的发现。比如可以将不同年代的数据添加到系统中,以考察信息化测评数据随年代的变化情况等。还可以与信息化测评专家共同探讨与研究,进而完善系统,以得出更多、更确切与更深入的结论。一般说来,可视化系统是为领域专家建立的,系统的使用可以促进专家们在各自领域的研究。

相关热词搜索:可视化 测评 信息化 信息化测评可视化研究 信息化研究 信息化作战研究

版权所有 蒲公英文摘 www.zhaoqt.net