[基于Ｗｅｂ２．０的专长识别与共享模型研究]中医确有专长中药识别

发布时间:2020-03-07 来源: 日记大全点击：

　　[摘要]结合web2.0的特点，在对专长进行深入研究的基础上，以复杂性建模思想以及知识管理的基本理论为指导，设计一种新的专长识别与共享实现方法――自适应专长识别与共享模型(AEISM)，该方法能克服传统方法中的部分缺陷，并解决新环境中所遇到的新问题，因此具有一定的实用价值。
　　[关键词]专长　专长识别与共享　web2.0　复杂　知识场
　　[分类号]G350
　　
　　1　引言
　　
　　专长是专家的技能，是一种个人的隐性知识，包括方法、技能、知识、能力、优点等。反映专长的任何有形或无形资源，如专家资历、行为、成果等，均称为专长证据，它是专长识别与共享的前提。
　　目前，国内外已有利用同行评议、知识库、E-mail分析、虚拟社区、组织内社会网络书签系统等方法来识别和共享专长。同行评议方法是由权威人士通过对待评专家的知识、经验和技能进行评价来鉴定专家的专长及水平，这种方法较为客观，但成本很高。知识库方法将组织以前所做过的事情、员工的思想、经验和知识存储在信息库中，计算机进行自动进行信息整合并抽取专长。机器克服了人的主观性，但只是对文档片段的分析，不能真正把握文档的语境，也不能代替人对文档的理解。Email方法通过对组织成员间邮件交流的分析，来识别组织内个体之间的共同兴趣。Email方法由于涉及到隐私，实际操作性较差。虚拟社区将用户的在线提问和专家的答案保存成为知识库，用户通过检索而获得答案，如Answer Garden。其侧重于通过存储和检索相关问题与答案而对专长知识予以显性化和进行重用，但不鼓励用户与专家的互动，因此专长可能不能被有效地重用和开发。社会性书签系统方法通过对组织内部用户对网络资源的标注行为进行分析，而提取用户的兴趣和专长，如Cogenz。但由于某些标签并不一定代表感兴趣的内容，标签并不仅仅是对内容本身的标著，还包括了对内容相关的其他标著，所以该方法也存在一定的缺陷。在Web2.0环境下，采用一定的方式，可以构建这些方法的综合运用，将有可能产生更好的专长识别与共享效果，基于此，笔者设计了自适应专长识别与共享模型(AEISM)。
　　
　　
　　2　AEISM设计与分析
　　
　　专长识别与共享是专长管理的主要部分，是利用和创造知识的重要环节，专长识别与共享在当今社会发挥着越来越重要的作用。基于Web2.0理念和技术，构建自适应专长识别与共享模型，从理论层面，在一定程度上解决了专长识别与共享中的一些问题。
　　
　　2.1适应性主体
　　AEISM系统是由大量具有主动性的元素(Active Element)组成的，这些主动性元素是系统的主体(A―gent)，主体包括两类：人与信息。人作为人件参与运算，是一种最具有适应性的主体；信息是人的行为的产物，在一定的机制的控制和约束下，也具有适应性。
　　2.1.1适应性从生物学角度说，适应是生物体调整自己以适合环境的过程，生物体结构的变化是经验引导的结果。适应性是所有主体所共同具有的特性，在CAS中，主体随着经验的积累，靠不断变换其规则来适应。任何特定的适应性主体所处环境的主要部分，都由其他适应性主体组成，所以，任何主体在适应上所做的努力就是去适应别的适应性主体。随着时间的推移，主体在环境中表现出适应与不适应，适应的继续生存，不适应的将会被淘汰。
　　在AEISM中，适应性表现在人(如专家、社团)、信息(如专长、知识库、规则)这两类主体是否能得到其他主体的认可，能否在系统中得以存在而继续演化，这就形成了一套适应性规范一“声誉(Reputation)”。声誉指的是人与信息主体是否满足其他主体的要求和意愿，如专家是否及时更新了其专长信息，是否积极参与社团的活动，是否愿意并努力认真解答其他主体的提问等，对社团而言，其是否组织了有意义的活动，活动频率怎样，专家的专长是否能在实践中发挥较好的作用等。可以预见，一些不适应环境的主体将会被淘汰，如那些不愿与其他主体交流的专家主体，即使其的确具备很高的专长，但由于其不愿意交流和贡献，经过一段时间就会被淘汰出局。同样，专家所提交的一些专长证据，也会由于无人使用而会被掩盖和埋没。
　　2.1.2主体　主体的引入，使系统的自组织得以发生，这些主体是杠杆的支点，一旦一个小小的输入产生，将会产生巨大的、可预期的直接变化――放大器效应。这些杠杆支点一旦连接成一个整体的系统时就会形成一个有机的整体，产生许多复杂现象，如专长和专家的不断涌现和发生。在AEISM中，主体包括人与信息这两类主体。信息主体是微主体(Micro Agent)，而“人”这一类主体又可以继续分为分主体(Component agents)、介主体(Meta-agents)、介介主体(Met-ameta-agents)。
　　微主体。微主体是一些信息的片段，如由用户提交的专长证据，或用户的其他行为所产生的证据，或是专家的某项专长本身等都可以看作是微主体，这些微主体参与了系统的运算。微主体的适应性是受控制和约束算法与规则限制的，这些控制和约束规则控制着系统的发展走向，如聚类算法可以将具有相同或相似专长的专家聚集在一起，而社会网络分析算法则可以构建专长网络，分众分类法的机制也控制着专家、专长及知识库的分类方法等。这样，一些符合规则的专长或专长证据就会在系统中继续生存，并能得到良好的利用，而一些不适应的专长或专长证据将会被逐渐埋没，直至被系统淘汰掉。
　　分主体。AEISM中最活跃，也最具有能动性的一类主体，是人、组织及以人为基础所形成的社团这一类主体，他们具有丰富的多样性和极强的适应性。主体是一个统一的称呼和概念，对于具体的每个独立的个体(如单个的人、单个的组织)而言，他们被称为分主体。分主体是AEISM中最基本的构成要素。主体不仅有层次的划分(如分主体、介主体、介介主体)，主体也体现了不同的角色。分主体具备了至少6个角色，并且这些角色可能在某个分主体上同时具备，角色之间可以发生相互转换，如图1所示：
　　分主体是系统中最核心的内容，它具有典型的6种角色：专家、标注者、投票者、评审者、编辑者和浏览者，这6种角色对应着分主体的6种不同行为，这些行为作用于系统，使系统不断演化，产生优越的专长识别与共享效果。编辑者的编辑行为是系统数据产生的源泉，也是系统进化的动力，包括提交其专长证据、更新其专长信息、参加活动、发表言论、协助他人解决问题等。专家是具有一定专长的人，其专长可以是多方面的，专家参与系统中的活动的过程，是一个不断贡献其隐性知识和不断创造社会价值的过程。评审者参与系统中一定程度的控制，评审者对专家资料和身份进行初步的验证，是对用户及有关文档片段的初步把关。标注者是最初的专长识别者，通过对专长证据资料的考察和分析，对申请成为专家的主体采用任意方向和数量的关键词对其专长进行标注和修正，完善专长的描述。投票者在与专家的交互过程中，可以发觉专家专长水平的高低以及专家是否有能力、是否愿意与其他用户进行交互，从而贡献其知识和技能，如果这些达不到投票者的要求，专家的声誉就会降低。浏览者强调的是在系统中只进行信息浏览和使用的低层次的用户，其本身并不象其他主体一样直接参与系统的运算。但其浏览行为和间接参与运算，如当某一个主体或某类社团被有很大的浏览量时，系统就有可能据此而识别出热门的主题或社团。分主体的这6种角色并非固定的，而是在不同条件下相互转化的。而且，同一个主体可以具备多种角色，也即分主体可以在系统中发生各种不同的行为，产生不同的运算结果。
　　介主体。分主体间按照一定的规则发生相互作用，并通过聚集的方式形成更高一级的主体，如社团，这类主体称为介主体。介主体反映了分主体的聚集特性，如以“信息检索”为主题的社团，说明其社团成员都具有信息检索方面的专长，或至少具备这方面的相关知识。介主体是分主体及微主体通过相互作用所涌现出来的结果，它主要包含各类社团和形成的专长体系。社团通常是具有共同属性的人组成的，他们的相互交流和作用，一方面可以作为反馈的一部分；另一方面也可以促进系统的进一步演化。
　　介介主体。介主体之间还可以继续发生相互作用，进行再聚集，如以“信息检索”和“软件工程”的介主体还可能通过再聚集，形成“计算机科学与技术”这一类新的主体，这类主体被称为介介主体。这个再聚集的过程经过数次重复后，就得到了CAS中非常典型的层次组织。介介主体则是介主体的进一步作用而聚集形成的更高层次的结构，影响着整个系统的进化，是一种方向标，如专家排名。
　　
　　2.2系统运行机制模型
　　AEISM的基本原理为：系统提供一个有机配置的知识场，由分主体先向系统提交能证明其专长的资料(即专长证据)，系统管理员初步评审用户的基本信息和所提交的专长证据，然后由其他分主体通过对这些资料的考察和分析，用数量不限的任意关键词对其专长进行描述；利用一定聚类算法，将所有分主体的标注结果聚集起来，将达到一定阈值的标签作为用户的专长标记，并按一定的算法计算出专长水平；利用分众分类法对专家、专长及专长证据进行组织，以标签云显示给用户使用。系统通过标签，将具有相同专长和兴趣的人管理起来，形成专长专家专长网络；系统提供多种用户交互机制，使专长能充分共享，用户的行为将会被记录和分析，继续构建和扩充知识库，以利重用和新知识的创造；用户也可以自主构建各类社团，社团也由标签来标记，举办各类社团活动；这个过程循环往复的进行，从一个非平衡状态走向平衡状态，使得优秀的专家得以涌现，用户之间的交互和标签之间的关联，也会涌现出各类社团。通过这种相互作用，系统结构和模式得以继续演化和完善，最终产生符合用户需求的专长识别与共享模式。该过程如图2所示：
　　主体的适应过程依赖于由其他主体所提供的、不断变化的情境。在AEISM中，这个情境便是由分主体的个人情境、所有主体的共有情境以及各类主体之间的相互作用所形成的氛围，这种氛围便是知识场。因此，一旦用户进入了本系统，便自然而然的进入到这个知识场中，受场的影响。主体的一切适应过程以及系统结构和模式的演化都在这个场中进行，同时，这种相互作用也促使场本身不断的变化。其中最核心的是主体自组织与涌现、系统反馈两个问题。
　　2.2.1主体的自组织与涌现机制
　　自组织贯穿于AEISM系统运行的始终，不仅以人中心的主体(用户主体)由于不断适应进行着自组织，而且人所的各种行为和所生产的各种数据，即微主体(信息主体)也在一定规则的控制下，不断进行着自组织。自组织主要体现在各级主体的自组织上，主体通过自组织聚集而涌现出新的主体(见图2)。
　　用户自组织。自组织的原动力是用户主体。编辑者编辑个人资料，构建专长档案，并不定期更新。标注者根据编辑者提交的资料和专长信息，对其专长采用任意关键词进行标注。评审者对编辑者提交的资料进行初步的审核，投票者通过对专长资料的考察和与专家的交互，对专家的专长水平和共享意识进行评定等。
　　用户自组织的动力机制来源于协同中的竞争与协同机制。用户为了在知识场中取胜，其必然要与其他人竞争。例如，专家为了赢得良好的声誉(因为声誉会给他们带来许多的潜在利益，如更高的学术声望、更好的职业机会、更多的产品用户等)，他必然会努力将表征其专长及专长水平的信息及时提交和更新，并积极参加社团活动，与其他专家和用户交互，共享和贡献其专长，惟其如此，他才有可能赢得良好的声誉，进而累积成功。反之，他将会被淘汰。这种竞争结果导致系统向非平衡状态发展。倘若现实中的专家投入到这个环境中来，因为其已有的名气，他能迅速赢得声誉，在竞争中获胜，他能找到更多的合作者，有可能带来更多的项目，这种激励也会促进更多的精英的加入，从而促进系统良性循环发展。众多专家的涌入，每个人的专长会有差异，其专长档案也会有较大不同，这种差异化是系统处于一种相对比较混沌的状态。为解决这个问题，用户之间的协同发挥了作用。
　　众多标注者对专家进行标注，标注的结果是使具有相同专长或者相近专长的专家聚集起来，同时，也可以将专长聚集起来，从而形成了一个新的有序的结构和模式，即所谓的序参量，序参量的出现标志着系统进入了一个平衡状态。当用户更新自身信息，或者新的用户加入，或者用户发生新的行为时，又会导致这种平衡状态被打破，进入了新的非平衡状态。AEISM不断的从非平衡状态走向平衡状态，然后平衡状态被打破，又通过自适应达到新的平衡状态，螺旋上升发展。
　　信息自组织。虽然信息本身并不能进行学习和主动适应，但和人一样，信息自组织也是由规则控制的结果。所以，强调信息自组织，更多的是强调其规则的设计和实现，在本模型中，主要表现为tag和文档片段的自组织。
　　标注者的标注行为产生描述专家及其专长的tag，系统用一定的规则对其实施控制，表现出适应性。最初tag的数量和内涵有很大差别，系统通过一定的算法(如聚类算法)将相同的tag识别出来，计算词频，当词频达到一定阈值，该tag便可作为专长标识。每个专家的专长实质上是一个tag的集合。具有相同tag的专家被聚集起来，形成社会网络，将更有利于其找到相关专家。当其中的某个专长消失时，必然又会有新的tag补上，发生态势的位移，从而体现出多样性。同时，由于标注者本身也是受所在领域限制的，所以其tag行为也必然会受其自身的专长领域和水平的限制，也就是说进行tag的用户的tag行为代表了自身兴趣和知识，这个可以促进其共同兴趣社团的形成。
　　文档片段自组织则是一种聚集算法和时序算法的控制。同一个专家的文档会按其专长聚集起来，不同专家的文档也会按系统的所有专长而聚集起来。并且，系统实施监控机制，对于一些使用极少或年代久远的文档，将会采取备份措施。系统中通过这些适应性主体的不断的自组织，使新的结构和模式不断涌现，系统不断演化，如图3所示：
　　各种适应性主体通过彼此问的相互作用，不断演进，最后由聚集而形成新的体系，如用户通过构建各种社区，而涌现出许多活跃的社区，用户的tag行为将导致专家的专长被识别出来，同时也标志了自身的知识和兴趣方向，通过用户间的tag关联，也构成了用户之间的社会网络，用户所提交的专长文档将被整合，形成一个相对稳定的可获取的知识库，供用户共享。这种方式将涌现出分众分类法，用来组织系统信息和用户，如图4便是对专家专长分众分类法的图示描述。
　　主体自组织是按照一定的内部模型进行的，其中用户自组织的内部模型上述激励机制，每个用户都要预见到如果其采取某种行动后将会产生的结果。信息自组织的内部模型则是系统中所设计的各类算法，信息按照算法进行演化。
　　2.2.2系统反馈本模型是一个开放式的系统，系统要演进和优化，循环反馈也是其中非常重要的一环，见图5。对于每个用户而言，通过其自身在系统中的自适应活动，是系统发生演化。同时，系统的输出结果，又会使用户的再次适应活动受到影响。在这些反馈中，最为主要的是负反馈，其结果是使系统进一步趋于稳定。在本系统的每一个部分，几乎都涉及到了循环反馈，例如编辑者提交的资料、用户tag及tag行为、社团主题、社团活动方式和频率等。
　　对于编辑者而言，若其需要成为专家，其必然会提交资料来证明。当其资料被得到很好的响应时，他便会发现什么样的专长、什么样的资料是当前用户所最需要的，甚至通过在与用户的交互过程中，他也会发现，什么样的用户值得交流，什么样的用户可以直接拉入黑名单。这种不断的反馈过程，使系统资料不断得到更正，越来越趋向于大众的喜好。
　　
　　3　结语
　　
　　在web2.0环境下，用户充分的个性表达也预示着他们具有某种专长，他们同样可能协助他人解决问题，从而，专长不再是少数权威人士的专利，“草根”也同样具有专长，同样可能成为专家，从而奠定了本文研究的基本思想和出发点。本文利用复杂性科学构建了自适应专长识别与共享模型，从理论层面在一定程度上解决了新环境下的专长识别与共享问题，具体包括以下几点：①将每个用户都视为潜在专家，系统能识别出每个人的专长与专长水平，并能识别出团体、组织的专长；②专家专长由用户的自由标签(tag)来标记，符合大众化的需求，从而使专长标记不再局限于专业领域的分类法，而是采用使能为大多数人所能理解和接受的方式，增强系统可用性；③专长证据提交，专长识别，社团组织等都由用户自身进行，采用用户参与架构的系统设计模式，有机配置知识场，使系统的自组织和演化自动进行，大大降低了专长识别与共享的成本；④提供了便利的专家搜寻路径，充分利用各种交流工具，并自动构建专长知识库，使专长的交流与共享的难度大大降低。

[基于Ｗｅｂ２．０的专长识别与共享模型研究]中医确有专长中药识别

热点文章阅读