中文HTML图文手册

HTML Manual

Search Engine 能 做 什 么

Search Engines : 穿 透 Internet 的 动 力

Search Engine 能 做 什 么

   如 果 你 想 在 Internet 上 找 到 你 想 要 的 东 西, 那 是 相 当 费 时 费 力 的 一 件 事。 怎 么 办? 方 法 很 简 单: 让 Internet 自 己 来 做, 而 且 幸 运 的 是, 现 在 有 了 一 种 新 的 Search engine 来 满 足 你 的 需 求。 在 没 有 WWW 时, 你 想 在 网 上 作 查 询, 只 有 很 少 的 几 种 选 择 -- FTP 上 的 Archie, Gopher 上 的 Veronica,以 及 利 用 数 据 库 的 WAIS。 虽 然 它 们 相 对 来 说 也 是 有 效 的, 但 它 们 的 界 面 却 不 够 友 好,信 息 量 也 很 有 限, 同 时 网 络 信 息 的 飞 速 膨 胀 也 使 得 它 们 濒 临 崩 溃。

   随 着 Internet 网 在 日 益 庞 大,在 上 面 查 找 所 有 的信 息 实 际 上 是 不 可 能 的。 你 仅 能 寄 希 望 于 长 时 间 的 搜 索 并 创 建 书 签 (bookmark) 和 热 门 节 点 表 (hotlist) , 但 他 们 在 不 断 地 增 加,几 乎无 法 管 理。 重 要 的 节 点、 资 源 在 每 周、 每 天 甚 至 更 频 繁 地 更 新 着。 必 须 用 新 的 方 法 来 解 决 这 个 问 题。

  网 络 用 户 看 到 了 这 些 缺 陷, 便 着 手 开 发 查 询 工 具,Search engines 就 是 在 这 种 情 况 下 发 展 起 来 的,并 及 时 地 填 补 了 这 些 缺 陷。 近 几 个 月 中 Search engines 发 展 很 快, 所 以 今 天 的 你 才 可 以 任 意 选 择 ( 它 们 中 的 大 多 数 是 免 费 的)。 想 要 查 找 财 经 信 息 吗? 从 Search engines 开 始。 市 场 导 向? 从 Search engines 开 始。 图 片 库? 是 的, Search engines 也 会 在 这 里 帮 助 你。

  那 么, 哪 个 Search engine 能 帮 你 找 到 所 需 信 息 呢? 我 们 对 14 个 主 要 的 Search engines 作 了 全 面 的 调 查 和 比 较, 查 询 范 围 从 股 票 市 场 信 息 到 音 像 出 版 物,因 为 任 何 单 方 面 的 测 试 对 某 一 Search engine 来 说 都 是 不 合 理 的,所 以 这 种 测 试 涉 及 的 方 面 应 该 比 较 广 泛 的。我 们 做 了 一 个 测 试 来 确 定 各 种 Search engine 的 响 应 系 数。 现 在, 你 的 主 要 任 务 就 是 选 择 一 个 适 合 你 的 Search engine。

评 论: 快 速 查 询 你 所 需 要 的 信 息

多 样 的 Search engines

  对 于 一 个 Internet Search engine,首 先,它 应 该 有 一 个 易 用 而 且 功 能 强 大 的 界 面。就 象 数 据 库 查 询 工 具 一 样, 用 户 界 面 是 成 败 的 关 键。 如 果 它 的 搜 寻 方 式 难 以 把 握, 用 户 是 不 会 对 它 感 兴 趣; 同 样,如 果 界 面 太 简 单, 你 也 不 可 能 按 所 想 的 方 式 做 查 询。 其 次,是 查 找 结 果 的 数 量、 准 确 性 和 可 读 性。 如 果 你 的 查 询 得 到 500 个 结 果 那 当 然 很 好, 但 当 其 中 400 个 都 不 能 连 接, 或 是 一 些 并 不 相 关 的 内 容, 恐 怕 你 就 笑 不 出 来 了。 同 样 如 果 你 查 不 到 任 何 结 果, 你 当 然 也 不 会 认 为 这 是 一 个 好 的 Search engine。

  Highlights : 当 你 使 用 各 种 Search engines 时, 你 会 发 现 它 们 之 间 的 差 别。虽 然 在 EINet GalaxyYahoo 中 你 可 以 仅 仅 输 入 简 单 的 查 询 字 符 串, 也 可 以 使 用 哪 种 Internet 服 务 器 (FTP, Gopher, HTML 等 等) 和 限 定 查 询 的 范 围 ( 文 件、 目 录 或 仅 是 地 址)。 InfoSeek, 是 我 们 的 测 试 中 唯 一 收 取 基 本 服 务 费 的 Search engine, 它 同 时 也 是 服 务 范 围 最 广 的 Search engine。 它 不 仅 可 以 查 找 网 络 节 点 (Web sites), 还 可 以 涉 及 有 线 新 闻、 杂 志 甚 至 电 影 评 论。 Open TextLycosJumpStation II 等 都 是 只 能 查 询 自 己 的 数 据 库, 同 时 每 个 提 供 商 都 为 用 户 显 示 了 不 同 风 格 的 界 面。WWW Worm 允 许 你 输 入 搜 寻 字 符 串, 并 决 定 其 逻 辑 操 作 ('与' 或' 或'-AND or OR)、 你 准 备 查 找 的 网 页 元 素 以 及 你 希 望 它 一 次 返 回 结 果 的 数 量。 在 CUI W3 Catalog engine 中, 你 可 以 选 择 是 仅 用 关 键 字 查 询, 还 是 用 一 个 Perl 语 言 写 成 的 查 询 语 句 来 查 询。

  一 个 最 新 现 象 是 Search metapage。 它 允 许 你 在 一 个 节 点 使 用 多 个 不 同 的 Search engines。CUSIAll-in-One 的 搜 寻 页 就 是 如 此。 虽 然 它 们 比 较 慢, 但 它 们 在 同 一 界 面 中 提 供 了 若 干 个 Search engines. 另 一 个 比 较 新 的 现 象 是 多 线 索 查 询 页 (multithreaded search page), 象 Internet Exploration Page 和 SavvySearch engine。 它 们 不 仅 允 许 你 同 时 使 用 多 个 engines, 还 允 许 你 指 定 使 用 哪 些 engines。 同 样, 你 也 可 以 设 置 你 能 够 忍 耐 的 等 候 时 间。 这 是 很 重 要 的,因 为 一 个 复 杂 的 多 线 索 查 询 (multithreaded search) 可 能 会 持 续 几 个 小 时。 在 SavvySearch 中, 你 也 可 以 不 指 定 使 用 哪 些 engines, 只 要 选 定 了 所 需 的 资 源 和 engines 的 数 目 即 可, 剩 下 的 工 作 就 由 它 来 完 成 了。

  Lowlights: 每 一 个 Search engine 在 显 示 查 询 结 果 时 都 是 不 一 样 的。InfoSeek 提 供 的 是 一 个 结 构 很 好 的 清 单, 每 一 个 连 接 点 都 有 注 释。 而 AliWeb 则 仅 仅 提 供 没 有 注 释 的 超 级 连 接。SavvySearch 虽 然 有 一 个 良 好 的 界 面, 但 它 在 显 示 查 询 结 果 方 面 做 得 并 不 好。 同 样, CUI W3 Catalog 的 界 面 也 不 够 理 想, 但 它 为 每 个 连 接 点 都 提 供 了 详 细 的 注 释。 而 Open TextElnet Galaxy 查 询 的 结 果 却 比 较 令 人 失 望。

  尽 管 查 询 结 果 大 部 分 都 是 没 用 的, 只 要 你 能 得 到 大 量 结 果, 而 且 它 们 又 都 是 可 以 连 接 的, 那 就 是 好。查 询 结 果 的 数 量 对 Search engines 来 说 大 都 是 不 成 问 题 的:AliWebEINet GalaxyWebCrawlerWWW WormOpen Text 都 可 以 提 供 广 泛 的 连 接 清 单。 只 有 CUI W3 CatalogJumpStation ⅡSavvySearch 做 得 不 够 好。 就 准 确 性 而 言, 结 果 就 比 较 令 人 失 望 了:即 便 是 做 一 个 象 " marketing in Japan " 这 样 的 相 当 明 确 的 查 询,CUI W3 CatalogAliWebWebCrawlerEINet Galaxy 在 准 确 性 上 都 无 法 保 证。 在 查 找 的 准 确 性 方 面, 只 有 InfoSeek 表 现 出 色。

最 后 分 析: 信 息 风 暴 中 的查 询 工 具

信 息 , 你 在 哪 里?

  哪 一 个 Internet Search engine 最 好? 对 Search engines 来 说, 它 们 都 有 各 自 的 优 缺 点。 而 你 最 好 的 办 法 是 学 会 怎 样 有 效 地 使 用 它 们。 我 们 则 非 常 欣 赏 InfoSeek ( 这 是 唯 一 收 费 的 Search engine)。 当 然 Internet Exploration Page、 YahooOpen TextWebCrawlerLycosWWW Worm 做 得 也 不 错。

  纵 观 Search engines,建 议 你 每 月 为 InfoSeek 花 费 $9.95, 你 也 可 以 使 用 WebCrawlerWWW Worm, 它 们 能 为 你 提 供 几 乎 是 你 需 要 的 全 部 信 息 ( 在 Lycos 中, 你 也 会 得 到 较 满 意 的 结 果)。 如 果 你 要 寻 找 的 是 纯 文 本 中 的 关 键 字, 那 Open Text 无 疑 是 最 快 的。

   而 metapages 方 式 -- All-in-One Search PageCUSI、 Internet Exploration Page 和 SavvySearch ,则 是 一 次 查 询 几 个 engines 节 点。也 许 你 会 对 这 种 方 式 更 感 兴 趣。可 是, 又 有 谁 想 启 动 一 打 engines 呢?虽 然 metapages 非 常 有 用, 但 它 们 却 有 自 身 的 局 限 性: 它 们 不 能 象 一 般 engines 那 样 提 供 全 面 查 找 的 规 范, 所 以 其 准 确 性 要 相 对 差 一 些, 并 且 速 度 也 是 相 当 慢 的。 而 且 多 线 索 查 询 页 (multithreaded search page) 必 须 以 自 己 的 方 式 与 其 它 节 点 连 接, 但 这 些 节 点 中 有 的 也 许 正 忙 于 另 外 一 些 工 作 ( 记 住, 提 供 免 费 服 务 的 服 务 器 是 要 不 时 地 进 行 维 护 的, 如 帐 号 管 理、 数 据 处 理 等, 以 保 证 系 统 的 正 常 运 转),这 些 都 会 使 你 的 查 询 停 顿 或 延 缓 下 来。

  现 在 有 一 个 明 显 的 趋 势: 免 费 的 Search engines 是 不 会 长 期 存 在 的。 InfoSeek 已 经 开 始 为 它 的 服 务 收 取 费 用。 出 于 商 业 目 的, EINet Galaxy 已 被 SunRiver 收 购 并 成 为 EINet 有 限 公 司 的 一 部 分。 America Online 最 近 兼 并 了 WebCrawler 和 历 史 悠 久 的 Internet 数 据 库 专 家 WAIS 公 司。Microsoft Network 也 被 允 许 使 用 Lycos。 这 一 切 表 明 搜 寻 的 价 格 在 Internet 中 尚 没 有 确 定。 但 有 一 点 是 明 确 的, 即 当 你 需 要 付 费 的 查 询 时, 你 希 望 它 们 会 更 出 色。 总 之,用 户 的 希 望 是 能 以 便 捷 的 方 式 得 到 准 确 的 查 询 结 果, 这 应 该 是 Search engines 的 发 展 趋 势。

编后语

   因 为 是 一 年 前 写 的 文 章, 许 多 内 容 已 经 有 了 很 大 变 化。 港 台 许 多作 中 文 信 息 的 站 点 也 都 提 供 中 文 方 面 检 索, 国 内 也 开 始 有 厂 家 涉 足 这 个 领 域, 但 要 完 成 一 个 好 的 中 文 检 索 系 统, 并 不 是 一 件 容 易 的 事 情。

 

Next-->page>>回上一页,看更多资料