温柔网

 找回密码
 注册

查看: 729|回复: 0

[转帖]网上查资料加速方法

[复制链接]
发表于 2005-4-20 02:27:52 | 显示全部楼层 |阅读模式
  网上的资料信息越来越多,怎样才能高效迅速地找到有用的资料呢?有几种技术可以使得更加快捷地找到所需资料。没有一种技术是万能的,但将几种技术巧妙的结合使用会大大加快网页搜索进程。几乎所有流行的搜索引擎都提供按词组搜索的功能,按词组搜索是一种在浩瀚的网页搜索相关网页的最佳技术。

  ■ 1.词组搜索
   如果只给出一个单词进行搜索,那么将发现数以千计甚至以百万计的匹配网页。然而如果再加上一个单词,那么搜索结果会更加切题。在搜索时,给出两个关键词,并将两个词用AND(与逻辑)结合起来,或者在每个词前面加上加号,这种与逻辑技术大大地缩小了命中范围,从而加快了搜索。幸运的是,所有主要的搜索引擎都使用同样有语法。一个带引号的词组意味着只有完全匹配该词组(包括空格)的网页才是要搜索的网页。例如在搜索说明中,有“this exact phrase(这个确切词组)”这个词组,那么搜索引擎只搜索包含“this exact phrase(这个确切词组)”的网页。

   下面举一个例子,一个人要查找惠普的MPE/ix操作系统的命令清单,他可能在Altavista站点只输入“MPE/ix”这个词,那么他可能会发现有2400个匹配网页;如果在填写搜索条件时写了“MPE/ix”和“Commands”两个词并用AND(与逻辑)结合起来,那么满足条件的可能是450个网页;如果在搜索条件上输入“MPE/ix Commands”,那么只有15条记录匹配,其中包括爱荷达州立大学计算与通信管理用户指南,其中对MPE/ix系统命令有详细的描述

  ■ 2.词组选择
   一般说来在网页搜索引擎中,用词组搜索来缩小范围从而找到搜索结果是最好的办法。但是,运用词组搜索涉及到如何使用一个词组来表达某一具体问题。有时简单地输入一个问题作为词组就能凑效,尤其是在Altavista这个站点上,因为它采用了“Ask Jeeves”引擎技术,该技术就常见问题给出预置的答案。

   在Altavista上输入“ Why is the sky blue(为什么天是蓝的)",就会在“Ask Jeeves"部分找到答案,并给出若干网页回答这个问题。然而简单明了的提问方法只对一部分搜索奏效。其他词组也可以作为搜索条件,尤其这些词组中有一个词十分独特或者该词组是几个词独特的组合。试一试用人名、产品名、甚至是嵌入程序中的字符串去搜索。

  ■ 3.巧妙利用错误信息
   将全部或部分错误信息作为词组进行搜索。当夏时制时间变化时,Netscape Navigator (浏览器)会产生一条错误信息,该信息包含词组“book marks have changed on disk(磁盘书签已变动)”。在Northern light 或HotBot 站点上输入该词组,就会找到对该问题的解释以及如何处理。

   DejaNews和新闻组文档经常发现一些问题很难甚至不能通过搜索引擎找到答案。由于新闻组更关注讨论而网页相对来说变更较少,DejaNews新闻组文档或许是一个较快的信息源。不幸的是,DejaNews 不能总是充分地处理词组引擎。尽管它遵守常规的语法,但是它的搜索引擎是处理器密集式的,而且经常只给出与搜索词组匹配的部分结果。有鉴于此,在DejaNews上搜索时最好直接键入词组不要加引号,并希望包含该词组的记录出现在前面。有些搜索引擎在处理词组时出人意料——忽略句号,搜索该词的其它形式,漏掉空格等等,但是在DejaNews中的处理过程中不存在。

  ■ 4.直接到信息源查找
   有时词组搜索太精确或者一个词组无法准确表达所需信息。那么可以直接到信息源,这种技术“简单得似乎不值一提”,但却很有效。根本不用搜索引擎,直接到提供某种信息组织的站点去。很多时候我们可以用公式“www.公司名.com”去猜测某一组织的站点。如果猜不中,那么到Yahoo去,或用搜索引擎。

   例如,要找Dell公司现有附件的说明书,直接去该站 http://www.dell.com/ ,想知道Oracle公司有什么新闻,试一 http://www.oracle.com/ ,然后再去新闻栏看一看。人们在搜索引擎中得到很多无用信息,却忘了试一试该方法。这种技术还可用于其他搜索目的,并不一定与公司有关。政府机构、职业协会、教育机构也可以提供很好的信息资源。有关人口统计请去www.census.gov,还能 http://www.acm.org/ 看看最近的会议清单。

  ■ 5.使用资料收集辅助工具
   我们在网上查资料经常会遇到这样的情况,资料是找到了,但可能分布在几十个甚至上百个网页当中,我们只能一个一个地打开网页,然后复制粘贴复制粘贴把有用的信息拿下来。这是一件很烦人很费时间的工作,有没办法可以自动把我们需要的信息全部搜集下来呢?推荐大家使用一个网页信息搜集工具:网页信息搜集助手。

网页信息搜集助手可以搜集翻页型结构和树型结构的网页。baidu、google等搜索引擎搜出来的一页一页的结果属于翻页型的网页,在网页信息搜集助手中设置好起始页和翻页页数即可轻松把这一大堆的网页里的有用信息保存到我们的硬盘中了。如果我们要搜索整个网站,或者和一个网页相关的所有网页,这就属于树型结构搜集了。不过树型搜集由于网页数量会随搜索深度呈指数级增长,所以要注意不要设置太深的搜索深度,不然搜集时间会很长,推荐设为搜索2层。

网页信息搜集助手可以搜集网页中的Email、网址、图片、文章四种信息,遗憾的是不能搜集flash和mp3,不过对办公来说已经够用了,是我们在网上查资料必备的一个辅助工具。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|Archiver|手机版|小黑屋|温柔网 ( 浙ICP备13033583号-8 )

GMT+8, 2024-5-3 12:19 , Processed in 0.037584 second(s), 22 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表