传奇游戏资源实时发布中心...

信息检索传奇之智能化研究

日期:2012-11-05 02:28 转自:网游频道

   息检索系统来进行信息检索的方式通常是:用户提交查询式给系统,然后系统从所有的文献中检索出满足查询的相关文献。与网游数据库系统不同的是,l系统通常提供的不是精确的“答案”,而是一系列的可能包含一定相关信息的文献集。查询式与文献通常是由自然语言表达的,而则需要通过相应的处理器将它们拆分成诸多的组成词汇,这一处理过程被称为索引(ndexing)。现今多数传奇之收稿日期:20030519中这一过程是自动完成传奇之。在索引过程中,一磐虚词被舍弃,如“传奇之”、“但”等,通常后缀与漏尾也会被去掉,剩下的只是能够具体表征查询与文献的词项,这些词项通常根据它们在查询式与文献中的重要性被子以加权。对于文献的索引操作是在后台进行的,并且文献通过记录每个词项以及它的相关性权值而再现。相反,查询的索引操作则是前台的,但是由于它与文献的索引采用相同机制,它们也采取相同的权值赋值算法。一个好的系统在将与查询相匹配的文献呈现给用户前会根据其相关度大小进行排序。
其中的一部分文献被判定是相关的(由要求的相关度决定),而另一些则认为是无关或不够相关。用户对被检索文献做出评价并通过一种相关性反馈。机制米修正原有的查询式,产生改进后的新的查询,进而可得到新的文献序列。
如果过程引入这种机制,则将不断地进行下去直到用户对返回的文献结果感到满意为止。通常通过这样连续的环境反馈,检索的不确定性可以大大减小。另外,有用的信息通过这种反馈也能从环境中的搜索经验和动作经验中抽取出来。图一就是这样的~个的模型。45刘合翔:=二亡用户兰笋一匹d怔叵三习,“是为用户提供信息服务、满足用户信息需求的必要手段,其服务质量的高低反映着信息服务的质量水平,因此m是信息科学研究中最活跃的领域之一。随着信息技术不断地发展,的思想与运作方式也随之发生了巨大的变化。
20世纪70年代以前,现代意义上的信息检索主要通过传统的批处理方式进行。而后在网络技术的推动下,诞生了联机情报检索系统。而因特网最终的普及则促使r走上了分布式、网络化的道路,其体系结构以客户机服务器和浏览器服务器的模式取代了原有的终端主机的模式,其网络环境也从原来的局域网扩大到了今天的ntemet为代表的开放网络。而其信息结构也逐渐柔化,系统功能从原有单纯的信息检索向综合信息管理与服务迈进。近些年来,以自然语言理解技术,模式识别技术,自动翻译技术,知识表达与推理技术,专家系统技术为代表的人工智能技术在信息检索领域的成功应用则更使信息检索的智能化水平得到了大大提高与加强。虽然技术日新月异,但的本质自始自终都没有变,变动的只是信息媒体形式、信息检索系统的吞吐能力以及存储与匹配的方法而已。因此信息检索的发展仍依赖于传统的信息检索的思想。2人工智能人工智能是计算机科学中关于设计智能计算机系统的一个分支领域,其目的是使计算机模拟人脑及人的思维具有某些类似于人的智慧特征,如理解语言、学习功能、推理及问题求解等功能。广义地讲,人工智能是关于人造物的智能行为,而智能行为包括知觉、推理、学习、交流和在复杂环境中的行为。人工智能的一个长期目标便是发明出可以像人类一样或能更好地完成以上行为的机器。自从上世纪60年代中期人工智能技术问世以来,人工智能技术已有了显著的成果,并已有一些系46统投入使用。人工智能的应用早已不仅限于计算机领域,而是已作为一种新技术与许多领域结合。
在这一过程中,人工智能不仅发展了其自身,也给各特定领域带来了革命性变化。信息检索便是其中的一个代表。具体地讲,人工智能方法建立的系统实质:是模仿人的大脑而展开的,其特色在于知识的逻辑推理.即以较完整的推理系统为核心,对知识进行组织、再生和利用。基于规则的推理思想是人工智能的本质特征。
然而传统计算机技术实现的与真『的智能尚有较大的差距,这主要体现在:人脑对信息进行的是并行处理,而传统的计算机则是串行处理。我们需建造各种新型的并行计算机来加快人工智能的发展。传统的计算机以非真即假(双态)逻辑为基础,而真正的智能系统运用的应是某种模糊逻辑。动物神经元远比传统计算机的基本模块要复杂,我们需要在智能机器中运用更现实的人造神经元。3人工智能技术在信息检索领域中的应用3.1智能化的需要3.1.1在人机接方面,传统的界面呆板,操作命令严格,用户往往不得不求助于检索中介的辅助才能完成任务,这与“最终用户化”的潮流是相悖的。用户希望检索界面以友好的、易用的形式出现,并能利用自然语言进行人机交互。3.1.2在检索策略构造方面,没有经过专1'3t练的用户很难从检索系统中得到信息满足,这主要由于用户往往不能准确表达自己的信息需求,甚至不知道自己真正的信息需求是什么。即使用户对自己的信息需求有清醒的认识,用户也很难选择较好的检索策略求得较好的检索效果。3.1.3用户对信息源的分布不熟悉,而且用户对选择数据库以及了解数据库等信息源的特点和使用方法还不够明确,这样就很难得到较好的信息满意度。3.1.4检索知识需以某种形式表达与推广。专家关于学科领域的知识,检索策略的知识以及检索的专业知识,还有多年检索经验的辅助知识还没有实现真正的及时共享。3.1.5信息检索的动态性需求方面,用户随着信息更新与老化的加快,对信息资源检索的及时性要求较以前更高,另外检索方法本身也需要不断的更新。刘合翔:3.1.6在处理多媒体方面。
传统的是以词的匹配来执行相关性判断,而对于多媒体信息的检索则更迫切需要借助中的模型识别技术来进行处理。针对中这些亟待解决的问题,人们对的智能化提出了更迫切的要求。3.2智能化的可能人工智能技术中的机器感知(知识获取),机器思维(知识处理),机器行为(知识利用),其核心是知识。实现知识的形式化描述,从知识的获取、表示、存储、组织、管理、推理直到进行智能化研究一直是人工智能研究的主要方向。信息检索现在虽然还没有达到知识层次上的加工处理,但它至少已通过间接的途径实现了对知识的处理,如把信息源作为知识的集合,而把信息源通过适当的方式加以标引,其目的也在于通过这些标引词来表达信息源中的知识点,并为用户的信息需求提供相应的知识辅助。1的目标就是真正达到在知识语义层次上进行信息服务。由此可以看出知识是与rr共同的研究对象,而对知识的获取、加工、处理、提供利用则是两者共同的目标。目前的智能技术主要包括人工智能技术和人工神经网络技术,其中人工智能技术。主要研究如何利用计算机软、硬件模仿、延伸、扩展人类智能理论方法和技术。而人工神经网络技术。则更注重对人脑结构的模拟。实际应用中往往可以通过结合与共同完成智能任务。长于知识的逻辑推理,它以一套完整的推理系统为核心,对知识进行组织、再生和利用的长处则在于对复杂知识的结构化组织,通过分布式计算、并行推理以及例子学习来实现智能化处理。是模拟神经元结构,决定了它的高度容错能力。的研究重点在于模拟和实现人的认知过程中的感知过程,经验形象思维,分布式记忆和自组织学习过程,而是符号处理系统,侧重于人的逻辑思维。这两者的结合正为信息检索的基于知识的智能化提供了可能。另外随着计算机软、硬件设备性能的提高和智能通讯、网络技术的深入研究,人工智能在自然语言理解、知识获取、表示和推理等方面研究的深入以及f领域对智能化的努力为两者的结合提供了强大的技术支持和广大的应用空间。3.3m智能化的关键技术3.3.1用户知识的自动获取技术用户知识通常包括用户的信息需求和用户背景知识等。通过在用户终端t运行一个监视用户的接gent.由它来监视用户信息搜索与浏览过程,将用户在浏览时的相关信息不断传给远端服务器,服务器再将信息进行整理、组织并从中分析出用户的信息偏好,服务器根据用户信息偏好进行新的的信息推荐。3.32特征提取技术在智能检索系统中读取文档,分析其结构并从中提取对用户查询有益的索引数据。
33.3机器学习技术包括基于解释经验的学习,基于事例的学习,基于概念的学习,基于类比的学习,基于神经网络的学习等。其具体的执行是先让~个智能gell带有最小的背景知识,然后通过几种方法学习用户的行为:一是观察用户,找出规律二是用户反馈(直接或间接)三是用户训练,直接给出例子四是询问其它gent。这样即使genl不熟悉某个用户的习惯,但经过一段时间的学习,它会逐渐了解用户的工作习惯,并逐步接替用户的工作。3.3.4推送技术推送技术最基本的形式是通知,针对这种服务,用户可以控制其通知形式与时间间隔。另一个是提要技术,用户以关键词、日期、数值、比较规则以及其它查询条件查找信息。提要可以实现查看页或其它信息源,寻找需要匹配的信息,并向用户传递信息。第三种是自动拉出,提供一种可供用户常查看的页。自动推送需要用户终端有特殊客户机软件,定期发出更新请求。3.4智能化的应用智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,这意味着用户可以彻底从繁琐的规则中解脱出来。最新传奇因此智能检索应对检索词有较高的判断能力、理解能力和处理能力。智能信息检索应能代替或辅助用户完成诸如选词、选库、构造检索式,甚至在信息数据库中进行自动推理查找等功能。因而全面的智能信息检索系统应是基于知识的信息检索系统,它的知识库中除了检索专家的知识和用户的有关知识外还将相关领域的信息内容以一定的知识表达方式存储在其中,系统对知识库检索推理的结果则是用户直接加以利用的信息.它往往建立在一个或多个专家系统基础:。人工智能可以导引用户不但在用户进行搜索、浏览时47刘合翔:~一给予直接的支持,而且能够提供具有独立搜索功能的智能体的幕后支持。构建智能榆索系统通常有两种方案可供选择:一是改进现有的信息检索系统的设计,实现基于概念和内容的信息检索(已有成功应用),将主要的应用领域放在对检索策略的构造上和友好用户界面的构建等前端服务上。再~种选择则是摒弃现有的信息检索系统的基本框架,构造全新的智能信息系统.但是这一工作目前难度较大,以现有的技术条件还难以实现。近年来,已经有大量的研究投入到了的改进工作中来,同时存对运用其它领域中的多方面成果上也不断有人做出尝试。其中倍受蹦目的一个领域便是智能信息检索。
在这些研究的推动下,一个信息检索的新分支智能信息检索(ll)便产生厂。在智能信息检索方面也有一螋不同方向的研究,其中基于知识技术应用格外引人关注。它的目标是在索引、相关性赋值以及丰富查询式表达能力七运用相关的应用领域知识。其中又以最后一项可行性最大,因为它可以通过不出现在用户奁询中,但与检索词在语义上相关的词汇来榆索相关文献。
图二是一个运用应用领域知识的的典型例子,其中的知识库可以将其存储的相关知识用于辅助优化查询式的构造。、毒r萄丽泵1一(壶廷蓟~~~还竺t兰竺到图i智能信息检索系统槿型这里,系统与户进行充分的交互是为了给出足够准确的搜索结果,系统应尽可能多地了解用户查询问题的领域、所需的信息类别、信息用途,尽可能多地获取用户状况资料更进一步,系统应能够根据某种规则来区分用户群体,确定其基本需求特征.从而将用户的需求夏多的融人到系统的开发与训练中用户对搜索结果的反应可以作为反馈由系统收集起来,在关于用户的传奇知识基础上的信息筛选被称为协作过滤。
搜索系统甚至可以提供用户间或查询之间的沟通途径,为用户提供多渠道的服务。目前在信息检索领域已经开发的有关的人工智能产品有以下几种。43-4-l智能搜索引擎:面向特定用户(用户侪息作为特殊知识)、基于知识的(知识域分析,慨念取代关键词)的信息检索机。智能搜索引擎可以预期户的需求,并可以有效地抑制关键词的多义性。3.4.2智能浏览器:智能浏览器是基于机器学习理论设计的智能系统,经过一定的训练后,它可以成为某个领域内熟练的搜索专家,帮助用户存网络中杏找信启、。智能浏览器的两个比较成功的实验原型足ebalch和。能不断地给用户推荐一系列的站点,并建立超链接。它可以i己录下数以万计的用户数据来训练自己,从而不断地更新知识。它会对成功的检索的每一个超链接用代表用户兴趣的关键词加以注释,并存人数据库。ktii。综合使用了信息挑选与信息过滤策略,它收集有关用户测览习惯的信息,熟悉用户的兴趣爱好,并使川各种启发式策略,对现有的知识进行推理,从而实现一个上有限资源的智能搜索。
3.4.3智能体。具有控制问题求解机理的计算单元,在网上通常是一个专家系统、一个过程、一个模块或一个求解单元。目前其研究小仅考虑了多gem的特殊应用功能,而且考虑了多gent问的交互。
4结菜语人工智能技术的发展是时代对社会智能化需求的体现,而人工智能与信息检索的结合则是人们对信息获取智能化的有益尝试。在信息检索系统中纳人人工智能技术将使传统的信息检索系统具有更好的用户界面,更高的检索效率和更丰富的检索手段。特别是基于知识的信息检索系统的开发在为信息柃索的最终完全智能化上迈出了可喜的~步。人工智能技术的引入正在使传统的信息检索系统发生着巨大的变化。以两者作为结合点的智能信息检索系统,也将随着这两方面研究的不断发展而更加完善强大。

上一篇:学校体育课程传奇及可持续拓展进步教育思想
下一篇:医学机能学级试验教学示范中心之建设传奇及拓展进步

      站长推荐

古典传统与闲暇教育
网络多媒体辅助英文报刊教学策略探析
专科艺术设计专业色彩构成教学谈论
探讨高职校国际商务专业的课程改革
一流民办院校文化氛围的营建
学校党建s思想教育讨论高职院校与谐校园传奇之构建
新建地方本科院校教学质量监控体系传奇之缺陷传奇及解决方案
新形势下高职院校学生思想政治教育探讨
信息技术传奇及语文课程整合传奇之尝试
高校网球俱乐部发展的思考