• 教育资源开发关键技术(三)——资源智能导航技术、资源语义检索技术

    普通类
    • 支持
    • 批判
    • 提问
    • 解释
    • 补充
    • 删除
    • 一、资源智能导航技术

    (一)简介

            智能导航是指在专业化具体领域问题深入分析与建模的基础上,建立多种设计流程控制机制,随时感知用户的使用状态,以静态或动态的方式,智能化地引导用户完成创造性设计工作的一种技术。智能导航主要用于专业化具体问题的解决,专业化和权威性是其重要特点。它以软件的好学易用、理解体贴用户为出发点,解决系统流程控制的灵活性和用户控制的灵活性之间的平衡。它使用户将工作重点放在设计工作的创造性的发挥上,而不是放在软件的使用上。智能导航就是要试图建立一种规范和机制,使设计类软件达到高度的好学易用、标准权威、使用灵活;达到使用人员稍加学习、甚至不用学习,就可圆满地完成设计工作的目的。

    (二)技术路线

     一个带有智能导航功能的设计类软件的结构组成如图 1所示:

    图1


           智能导航按其对用户的导航方式可分为静态导航和动态导航。静态导航是通过设计流程的箭头指示等静态信息来指导用户设计。动态导航是随时感知用户的设计进展状况及设计数据处理情况,动态地改变设计流和有关命令的显示状态等,更加灵活、合理地指导用户设计工作。智能导航的关键技术主要包括领域专业化设计知识、设计流程分析与建模、人工智能技术、自适应人机接口技术、标准化技术、软件技术、数据库技术、面向对象技术等。

            建立智能导航的关键环节有分类、分析、建模、设计、测试等。”横向分类, 纵向分层“是其实施的基本原则; “动态静态相结合” 是其实施的基本措施;串并行约束分析、时序约束分析等是其实施的基本手段。  

    (三)技术实现

     

      1.指引库的建立

     所谓指引库是指这样的一个数据库,从物理上讲并不存储各种实际的信息资源,但对其访问却可以检索到有关数据库的实际内容,即指引用户到特定的地址获取所需信息。

    指引库中的信息资源可以采用主题树方式进行组织。指引库犹如一棵信息树,其根部是主页,一级分支可包括文献形式、文献类别、文献主题、文献提供者等等。每个一级分支又可分为若干二级分支,二级分支下又可细分,如此逐级分支下去直至不能分支为止。最后并列的部分按照字母顺序排列,并在各部分后面注明提供该部分文献的网站地址,这样就形成信息树的叶子节点,即用户的检索目标。建立指引库后,用户即可采用树浏览方式逐级浏览,找到所需的信息线索,从而减少了“迷路”问题的发生。

     

    2.网上信息自动跟踪技术

     

    因特网上的各种信息资源相当一部分是处在动态变化的状态中,同时,由于指引库包含的内容丰富、数量庞大,更新指引库也是一项繁重的工作,靠人工完成几乎是不可能的。因此,网上信息的自动跟踪技术也是实现智能导航的一项关键技术。

    自动跟踪技术可以从两个角度来考虑:一是参照搜索引擎中的网络机器人更新指引库,二是利用搜索引擎的检索结果,了解网上资源的变动情况,更新指引库。

     

    3.用户行为的提取和用户模型的建立

     

    智能导航系统的用户模型主要包括用户定制和系统自动提取两部分,对用户行为的提取一般分为3个层次。层次1:根据网络访问者的要求确定内容。层次2:根据访问者隐含的要求确定内容。站点根据较一般的问题,猜测确定访问者的兴趣和需求。层次3:根据访问者的行为确定内容。站点建立个人数据库,库中记录访问者的访问路径和执行的操作。

     

    4.用户个性化导航信息查询

     

    在建立用户特征数据库的基础上,不同的用户由于其知识背景、兴趣爱好、检索目的等方面的不同,往往需要不同的导航建议。因此,智能导航系统应根据不同的用户给出最恰当的导航建议。

    可以结合数据库的用户模型,对用户最近关心的内容进行加权处理,使提供的导航建议能更好地满足用户的需要。根据用户选择浏览的URL,进一步找出与其内容近似的其他URL,提供给用户,供用户找到相关内容。当服务器数据库的现有资源不能满足用户查询需要的时候,可以链接到其他搜索引擎进行查询,提高用户的查全率。为适应用户个性化需求,可在界面风格、字体、检索结果排列格式等方面让用户进行自由的定制。

     

    5.信息资源的发送

     

    当用户订阅的网络信息资源发生更新时,智能导航系统要负责及时地将更新后的资源发送给用户。目前,有两种信息发送方式:一种是目前很多网上订阅所采用的利用电子邮件、手机等工具通知用户有新的信息来到,用户可以到相应的网站浏览。另一种是比较先进的“push”方式,利用一个push服务器和客户端软件,用户在初次使用时定制好所需信息,站点的Push服务器收集更新了的信息,并将更新后的信息发送给客户端,用户则可在客户端利用相应软件获得最新的信息。这种方式利用Push技术和离线浏览技术,避免了用户繁琐的查找和等待,而且一次从网上发送过来的信息可以提供给多个用户,有效地降低了重复信息在网上的发送,同时可控制无用信息的流入,提高了信息检索效率。

     

     

     

    (四)技术方案

     

    1、数字图书馆导航力模型构建

    2.学习资源的智能导航系统构建

     

     

    (五)应用案例 

    在生活中的应用:

    GPS导航系统、冰箱的智能导航、视觉智能导航车等

    在教育中的应用:

    图书馆智能导航

    • 二、资源语义检索技术

    (一)简介

           语义检索的定义:语义检索又称概念匹配,即自动抽取能够描述文献内容的概念,用文中的关键词或与之相应的主题词加以标引;用户在系统的辅助下选用合适的词语表示自己的信息需求;在此基础上两者之间执行概念匹配,匹配在语义上相同、相近、相包含的词语。例如,用户要查询的是“操作系统”,“UNIX”,也是与之相匹配的词语。

            目前国内外普遍认同的语义检索技术是潜在语义检索和基于本体的语义检索。

            潜在语义检索(LSI, LatentSemantic Retrieval)或称隐式语义检索,是一种基于统计概念的信息检索技术。它利用统计学的方法,根据概念上的匹配实现信息的检索。使用潜在语义检索,是为了克服传统的基于单词匹配的信息检索方法某些方面的不足。

            基于本体的语义检索(Ontology),提出本体概念的目的是通过本体捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些术语和词汇间相互关系的明确定义

    (一)技术路线 

    基于本体的语义检索技术路线图:

                                                    

    (二)技术实现

    1.隐式语义检索的技术实现:

           隐式语义索引(Latent semantic indexing)提出的目的基于一种假设:即在千变万化的各种词的组合下隐藏着语义结构,可以通过某种方式来估计这种结构并去除噪音。

        通常情况下,这种语义结构空间被称为(隐藏的)概念空间,有点类似于神经网络中的隐单元概念,对概念空间的定义在数学上目前是并不严格的,没有一种严格的数学手段可以确定:在某个特定任务下,某个尺度的概念空间一定是数学上最优或较优的。在实际应用中,概念空间的定义往往需要对数据文档集的不断测试和修正。这是一个非常费时的过程。

        目前,概念空间是通过一种叫奇异值分解(Singular value decomposition: SVD)的统计学方法来进行估计的。具体做法举例如下:

        考虑一系列文档,

        C1: Human machine interface for Lab ABC computer application

        C2: A survey of user opinion of computer system response time

        C3: The EPS user interface management system

        C4: System and human system engineering testing of EPS

        C5: Relation of user perceived response time to error measurement

        M1: The generation of random, binary, unordered trees

        M2: The intersection graph of paths in trees

        M3: Graph minors IV: Widths of trees and well-quasi-ordering

        M4: Graph minors: A survey

        C与人机交互有关,M与计算机图形学有关。首先,为了减少计算规模,只是用带下划线的关键词作为分析对象,得到词-文档矩阵A如下:

     

           A的SVD分解目标是将其分解成三个参数矩阵,使得A=UXV,经过SVD之后,得到三个分解后的矩阵U,X,V
    其中X是一个有序对角阵,可对其进行主分量分析,提取出对角元素最大的子阵作为semantic分析的变换矩阵。这样,在目标文档进来以后,针对词典[human,...,minors]可得出一个向量B:[0,0,1,...]

           通过矩阵运算BUX可得到B在概念空间中的向量(0.179,-0.004),则:可通过计算向量间夹角得到文档间的相似度。

    在自然语言模型训练中的应用思想:考察整个句子中,xy与xyz在概念空间中的夹角,夹角为0则表示xy及xyz在semantic上有最高的关联性。关键问题是UX如何求取。

           这一方法的缺陷,一是矩阵运算对存储空间及运算能力的要求过高(尤其在文档数量非常大的情况下),二是对semantic的解释与人们对传统语义的理解并不相符。

      

     

    (三)技术原理 

    1.基于隐式语义检索的技术原理:

            隐含语义检索假设文档的意思是由某个或某些词的出现与否及它们出现的频率决定的,不以分离的单词作为处理对象,使用统计学的方法,根据文档中单词之间的关系,达到概念匹配的目的。由每个文档中各单词的出现频率生成文档向量,再将所有的这些文档向量放在一起生成文档一词条矩阵A,该矩阵中的第i行的第j个元素的数值aij表示了第j个单词在第i个文档中出现的频率。对矩阵A进行截断的奇异值分解(Truncated Singular Value Decomposition, TruncatedSVD),生成2个正交矩阵U,V以及1个奇异值对角矩阵∑。这3个矩阵蕴含了比分立的单词更多的文档信息,文献的检索就根据用户的查询条件和上述分解后的3个矩阵而实现。

    2.基于语义 Web 的语义检索实现原理:

     

    在语义 Web 环境下实现语义检索实际上就是将 Ontology 所反映的语义关系应用到对信息资源的标引和检索中,具体就是要通过对相关文件的解析和推理在语义层面实现信息检索,并以适当的形式和友好的界面与用户进行交互。

     

    (四)技术方案

    1.精品课程本体库系统模型:

                                                                                 

                                                                                           精品课程本体库系统模型

                                                                            

                                                                                                      检索模块结构

     

     

     

    (五)应用案例 

    1.人民金典语义查询系统:http://www.rmjd.net/index.action。“人民金典”语义查询系统就是为了方便广大用户查询和使用这个数据库中的内容,提供强大的信息检索功能。本项目属于语义检索技术领域,主要做法是依托中国共产党思想理论专业领域的专家知识和经验,把传统文献编目的方法引入计算机检索,模拟人脑的思维模式,构建基于语义分析的模型,形成了该领域的知识库。目前该知识库的主要内容资源是马列著作、领袖著作、中央文件文献及相关中国共产党思想理论的重要资源。


     

    2.维基百科中的语义查询:自2007年开始,DBpedia开始自英语维基百科的“infoboxes”和“页面分类”提取数据数据,借由资源描述框架的技术创建可供查询的语义网计划。同时直接通过包括Semantic MediaWiki等转换技术的协助,使得维基百科的数据数据能够在网站上扩展成为可供阅读的语句。而这些导往其他网站的数据信息也能够重新使用于维基百科计划,除了能够在同一语言版本的维基百科文章之中引用,同时也能够提供信息给其他不同语言版本的维基百科使用。

     

    3.Metawab: Metaweb不仅开发了互联网语意数据存储架构,还有开放并可共享的全球知识数据库Freebase,你可以在Freebase进行协作编辑,以此为基础打造语义网络。Freebase允许任何人贡献、分类、搜索、复制并使用其中的数据,听起来有点像是维基百科,但它并不是按照文章来排列好的,而是以数据库为组织形式存在,可以被软件和人类所读懂。

       

    • 四、参考文献

    [1]王学群,王学礼,赵汝嘉. 智能导航指导下分布定制式CAD[J]. 计算机辅助设计与图形学学报,2001,01:8-12.

    [2]王学群,王学礼,赵汝嘉. 支持设计流的智能导航技术研究及应用[J]. 小型微型计算机系统,2000,05:475-477.

    [3]柯青,焦玉英. 网上信息资源智能导航系统的实现技术与原型设计[J]. 图书情报知识,2003,04:45-47.

    [4]吴德伟,邰能建,戚君宜. 基于认知理论的UCAV智能导航研究新进展[J]. 空军工程大学学报(自然科学版),2011,04:52-57.

    [5]孟崇,涂锦辉,周楹君,申辉,苑晶. 基于RFID的室内智能导航系统[J]. 南开大学学报(自然科学版),2010,06:87-93.

    [6]林珲,杨育彬,朱庆. 基于内容的虚拟地理场景检索与智能导航技术探讨[J]. 地理与地理信息科学,2004,01:1-6.

    • 标签:
  • 加入的知识群:
    学习元评论 (0条)

    评论为空
    聪明如你,不妨在这 发表你的看法与心得 ~



    登录之后可以发表学习元评论
      
暂无内容~~
顶部