传奇游戏资源实时发布中心...

基于GoogleWebAPI之传奇网页获取技术探讨

日期:2012-09-28 16:08 转自:网游频道

    的约束:)要访问的服务,必须创建一个账户并获取一个授权码,免费的授权码的使用是有限制的.缺省情况下,每天可以使用授权码进行1000次查询。2)每次搜索最多只能返回10个搜索结果。而且.通过这项服务,只能找到前1000个结果,也就是说,可以找到索引号在991到1000之间的结果。但找不到第1001个结果。
  3.用构建应用程序用户每次使用查询时,会提交一个查询词和一些参数,接收从小返回之传奇一系歹搜索结果。这些搜索结果来源于00小索引之传奇数以百亿计之传奇网页。模型结构见图1。3.1创建一个搜索00类封装了的主要接。它通过提供了搜索和存储网页的功能。00类的方法用于通过091执行搜索。暇方法则用于设置用户获得的授权码。对于所有的搜索,这个属性的设置是强制性的。搜索的关键词即查询词是由设置的。查询词可以是一个词。一个短语,或是一个简短的句子。先创建一个类的实例,然后调用该类的方法。该方法执行搜索并返回一个091.类的实例。出封装了通过调用—搜索所返回的所有结果。得到搜索结果后,可调用.类的方法,把返回的结果转换成字符串格式并打印出来。而.3.3获取并将其保存到一个文本文件中类的实例是把搜索到的十条结果当作~个整体返回。而其皿方法则把搜索结果玩家表达以一个异茈类型的数组的形式返回。这十个搜索结果由1至10分别索引。把看作是由出返回的搜索结果中的单个元素的~个容器。
  其方法则可以获取到单个搜索结果中的网页的。为了搜集更多的,可以把搜索的保存到本地磁盘的一个文本文件中。当调用了的搜索并得到结果以后,使用中的文件输入输出类眦锄来读热血传奇写这些结果。方法是创建一2007年第1期福建电脑115个锄类的实例,然后从1到10逐个访问搜索结果的单个元素,从而得到其中的。调用类的谢方法就可以把这些写入文件。实现的时候需要注意的是,中数组的下标从0开始。而搜索结果的索引从1开始,所以在访问搜索结果时,数组下标要减1才能得到正确的结果。
  通过调用搜索的时候,每次只能返回10个搜索结果。这10个结果.默认的情况下就是索引从1到10的排在结果最前的10项结果。在出中的出.类封装了方法,该方法可以让用户设置所返回的搜索结果的开始索引号.虽然每次搜索结果只能返回个结果,但通过这个方法的设置。可以进行多次的搜索,从而检索到更多的结果。比如.第一次通过该方法把开始索引号设置为1.第二次搜索的时候把索引号设置为11,依次类推,就可以得到更到更多的搜索结果了.还可以在自己的代码中更改一次返回结果的个数。缺省情况下,一次返回的结果包括10个搜索结果项。通过出类的)汛8方法来改变执行一次搜索结果的个数,但取值不大于10。3.4筛选搜索结果通过设置各种筛选条件对的搜索结果进行筛选2。设置筛选条件的各个方法如下:1)舻对搜索结果的语言进行筛选,如,只要中文,或只要英文的结果。也可以设置多种语言,不同语言之间用”¨分开。如只需要中文简体和中文繁体的搜索结果。可以把此处的值设置为:1—.2)对搜索结果的国家地区进行设置。可以设置一个或多个国家。例如.只想查找来自英国的数据,那么可以设置此处的置为””。3)设置是否过滤成人信息。当设置为真时,包含色情或直接的性描写内容的网页会从搜索结果集中剔除。4)设置是否筛选掉相近结果。设置为真时,如果搜索结果非常接近,则会剔除掉其中一个结果。
  这个属性也可以限制搜索结果来自同一个服务器的情况。如果一个网站上有10个网页都和查询词匹配,则只会返回这个站点的前两个结果。5)设置返回结果的开始索引号。例如,如果搜索结果有150个,那么可以选择从第30个开始返回。6)设置返回结果的个数。缺省情况下是10个结果.可以更改为10个以下的结果。更详细的筛选条件可以在网站上找到。
  筛选条件必须在调用搜索之前设置好.各个筛选条件之前并不冲突.因此可以设置多个条件。3.5获取网页用户可以通过集成在自己的程序中新开传奇来获取索引的海量网页。4.1创建一个简单搜索的实验结果在应用程序中,设置查询词为佛,运行程序后,所得的搜索结果如下:可以看到,搜索结果返回了很多细节信息。
  在最上方,可以看到搜索所用的时问为0.257144秒;搜索的查询词为,7;搜索结果关于的网页总数约为207000000;开始的索引为,最后索引为10.也就是说返回了207000000个结果中的前10个结果。
  4.2获取网页的搜索结果运行::,..,删0.2:婶帅.0“‰,“.“.9::,.01.一3085413.“2003052.10:币:州.日1..—。.“0!这个程序中可以得到并获取相应的网页。
  把这些网页保存到本地磁盘,可以构建一个大型库。5.总结论文描述了如何应用幽构建应用程序来获取网页。通过搜索应用程序所获取的结果。包括和网页,都可以保存到本地磁盘,从而建立库和库。以便在此库的基础上进行某种趋势分析.或者可以通过它来监视和某一主题相关的信息。与重新开发一个搜索引擎来获取网页相比,使用出来构建搜索应用程序来获取网页.所消耗的人力物力将成几何级数下降。而所得的结果却并不会降低。而搜索应用程序.也必将成为将来发展的一个热门探讨方向。
  尊眷,璺笆是掣建!、,。出詈!誊塑例。竺茔次翌用参考文献:的号。等兰蒙譬嘤琶喜要兰哎鋈毫兰夏=个之挚罢笔.。二。;磊0-.电子文献出硝:婶:,。.。舀。
  .。
  √印。引用锄,用于给每个网页文件命一个合适的文件名。可以指二忑。~。一一向各种类型的文本,最普遍的是类型,当然也可能是.1(111。
  .。辨北。文件,文件,文件等。『1电子文献出处::.郎很少,在系统开发中省去了很多代码。提高了编程效率。4.结束语本文使用实现7与++混合编程.并用其对图像进行了二维小波分解。此种方法的优势在于:它提供了中大量成熟函数:发挥出++的平台优势;程序可脱离运行环境:其编写代码简单易懂,提高了编程效率。版社,2004。2.盛歆骑.边继东等..与++混合嫡程在上的实现.江南大学学报.2003.43.王周益。
  刘继兴。柳长安。++与蝠混合缡程探讨及开监实例。
  计算机应用探讨,2006.14.何强,何英。脚蛆扩展鳊程。
  清华大学出版社。2002。揭施文(1983一),男,硕士在读,主要研究方向:地理信息系统,数据压缩技术:163.基于的网页获取技术研究作者:胡燕,吴虎子作者单位:武汉理工大学计算机科学与技术学院,湖北,武汉,430070刊名新开传奇:福建电脑英文刊名:年,卷(期):2007(1)参考文献(2条)1.20062.电子文献出处2006。

上一篇:基于日志之传奇数据库恢复技术之传奇探讨
下一篇:企事业单位网络安全管理与防护策略

      站长推荐

学校党建s思想教育讨论高职院校与谐校园传奇之构建
信息技术传奇及语文课程整合传奇之尝试
探讨高职校国际商务专业的课程改革
新建地方本科院校教学质量监控体系传奇之缺陷传奇及解决方案
网络多媒体辅助英文报刊教学策略探析
一流民办院校文化氛围的营建
新形势下高职院校学生思想政治教育探讨
古典传统与闲暇教育
专科艺术设计专业色彩构成教学谈论
高校网球俱乐部发展的思考