毛慶禎 輔仁大學圖書資訊學系 |
網路資源
2002/9/30
|
列名在此的搜尋引擎, 純粹是使用率高或知名度高。網站最喜歡被列入這些搜尋引擎的資料庫裡, 它帶來人潮及錢潮。對使用者而言, 高知名度的搜尋引擎, 表示可信度高, 經常維護並更新其內容, 跟上網頁的成長。
Crawler/Spider(爬蟲/蜘蛛精)、Directory(主題名錄)指搜尋引擎資料庫的製作方式, 前者由軟體自動產生, 後者靠人工編製。
有很多方法, 可以把自己的網站奉獻給搜尋引擎; 至於成千上萬的搜尋結果, 都有一定的排序邏輯, 用錢來買通是最直接的思考之一。以上是當今公認主流的搜尋引擎, 提供程度不一的中文資料檢索。
- Google, http://www.google.com
- AllTheWeb.com(FAST), http://www.alltheweb.com/
- Yahoo!, http://www.yahoo.com/
- MSN Search, http://search.msn.com/
- Openfind網路資源搜尋引擎, http://www.openfind.com.tw/
- 蕃薯藤, http://www.yam.com/
還有一些網站也還不錯, 可惜不支援中文, 而且也有點鈍鈍的。
具有潛力的網站, 值得注意:
- Lycos, http://www.lycos.com/
- Ask Jeeves, http://www.askjeeves.com/
- AOL Search, http://search.aol.com/
資料庫提供者, 本身不期待終端使用者:
- Teoma, http://www.teoma.com/
- WiseNut, http://www.wisenut.com/
碩果僅存者, 還有足夠的人潮. 或者被若干人視為重要的, 其實, 它們都已過氣了, 不再居於關健地位。
- Inktomi, http://www.inktomi.com/
- LookSmart, http://www.looksmart.com/
- Open Directory, http://dmoz.org/
- Overture, http://www.overture.com/d/home/
其他搜尋引擎, 知名度不高, 但仍可取
- AltaVista, http://www.altavista.com/
- HotBot, http://www.hotbot.com
- Netscape Search, http://www.netscape.com/
社區型的搜尋引擎, 由志工完成。
- About.com, http://www.about.com/
- Britannica.com, http://www.britannica.com/
- Excite, http://www.excite.com/
- iWon, http://www.iwon.com
- WebWombat, http://www.webwombat.com.au/
- WebCrawler, http://www.webcrawler.com/
- PepeSearch, http://www.pepesearch.com/
- Aeiwi, http://www.aeiwi.com/
- SearchKing, http://www.searchking.com
- Qango.com, http://www.qango.com/
- Open Directory, http://dmoz.org/
- Zeal, http://www.zeal.com/
- Xoron, http://www.xoron.com/
中文介面及中文資料庫。
雖然,新一代的小型搜尋引擎正在迎頭趕上, Google仍集所有的搜尋引擎功能於一身的產品。有著最大的URL資料庫,往往還能找出非常準確的搜尋結果, 排序也很精準。是搜尋引擎的第一站。
每個人都喜歡用Google,因為它簡單而實用。很多人都在用它,甚至連古巴的Juventud Rebelde這樣的反美網站(西班牙文)也在採用它。
Google有82種語言的版本, 包括中文繁體與簡體。
除了網頁, 還可以搜尋網頁裡的圖片、Usenet裡新聞群組的討論內容、人工編製的Open directory網頁目錄; 此外, 還有一個自編的分類目錄, http://catalog.google.com/, 以及新聞檢索目錄, http://news.google.com/。
它的資料庫會把網頁快取住, 若干已經刪除的網頁, 仍可從Google裡查到; 英文拚字檢查是不可或缺的功能, 線上英文字典, 股價查詢、街道圖、電話號碼等功能一應俱全。http://www.google.com/options/
- Google Answers - answers.google.com
- Google Catalogs - catalogs.google.com
- Google Groups - groups.google.com
- Google Image Search - images.google.com
- Google News - news.google.com
- Google Special Searches - www.google.com/options/specialsearches.html
- Google University Search - www.google.com/options/universities.html
- Google Web Directory - directory.google.com
- Google Wireless - www.google.com/options/wireless.html
- Google Translate Tool - www.google.com/language_tools
AdWords是新推出的商業機制, 查詢之後, 在右邊出現Sponsored Link, 訪客點選之後, 才付廣告費。
Google是美國史丹福大學學生Larry Page與Sergey Brin的研究計畫BackRub, 到了1998年才成立公司, 並改名為Google。
Paid search provider, Overture透過拍賣方式向出價最高者出售其搜索關鍵詞,這是一種與黃頁相對應的方式。而Google則搜索互聯網上每一頁的索引,然後根據其專有的統計系統對這些頁面進行分級, 該網頁被連結的次數, 也就是受歡迎的程度。
Google的AdWords Select策略, 銷售網頁排名順序, 把右上角的空間, 出售給買下檢索關鍵詞的廠商, 如computer賣給www.BizRate.com。https://adwords.google.com/select/
因此,目前出現了一類全新的搜尋引擎,試圖提高準確率,或者更好地組織搜尋的結果,以便於瀏覽。
有些搜尋引擎的目標是要打敗Google,成為新的搜尋引擎霸主;還有一些只是希望成為一種具體的研究工具,增加搜尋的深度,縮小搜尋的廣度。
英文介面, 中文資料庫
如果, Google不能連線, AllTheWeb.com必然是Second Best, 這麼說也不太公平, 某些人把它當成No. 1 Best。
除了網頁, 還可以檢索新聞、圖片、影像、MP3、FTP檔案。它是FAST公司搜尋技術的展示間, Terra Lycos從1999年五月開始使用AllTheWeb.com的技術。
中文介面, 中文資料庫, http://tw.yahoo.com/
老牌主題名錄, 1994年就開始運作, 由人工編製其名錄。是臺灣地區使用率最高的搜尋引擎之一。
雅虎公司成立於1995年三月,並於1996年四月成為一個上市公司,創辦人為楊致遠及David Filo。每月使用者超過二億人次。
除了經營搜尋引擎之外, 還有其他業務, 包括客製化企業入口網站整體解決方案、影音廣告、虛擬商店託管、及網站工具及服務。目前雅虎公司在全球共有二十四個分網,總部位於美國加州聖克拉克市(Santa Clara),在歐洲、亞洲(包括臺灣)、南美洲、加拿大及美國皆設有辦公室。
Yahoo!奇摩(www.yahoo.com.tw)是奇摩被雅虎併購後的公司, 專為臺灣地區的客戶服務。根據研究調查機構如NetValue、Nielsen//NetRatings等針對台灣地區的家庭上網用戶調查顯示,Yahoo!奇摩不論在網站的流量、不重覆使用者、國內網友的到達率與網友平均停留時間都名列第一,為台灣最受網友歡迎的網際網路領導品牌。Yahoo!奇摩提供七大類服務: 資訊、社群、商務、我的、娛樂、服務、頻道等, 內容包括: 信箱 、書籤 、筆記、相簿、通訊錄、行事曆、免費網頁、影音、電影、音樂、卡通、笑壇、賀卡、字典、大哥大等三十多項服務。
不能在雅虎自身的名錄裡找到所需資料時, 它會自動轉向配合的資料庫Google。
廠商可以付費要求雅虎把公司網頁置入其資料庫裡, 惟仍需達到雅虎自訂的標準; 雅虎自己找來的, 或非商業性的網頁, 仍免費被置入其資料庫。
一般性的查詢, 雅虎奇摩是第一選擇。
中文介面, 中文資料庫。http://search.msn.com.tw
微軟公司的搜尋引擎, 持續增修中, 編輯監看網路上各地的搜尋行為, 隨時調整自己的內容, 配合使用者的需求。
搜尋結果分三類顯示:
推薦網站是 MSN 搜尋的編輯群認為特別相關與有用的網站,選自由 MSN 子公司、合作夥伴、贊助商和廣告商公佈的網站,以及我們使用者的網站中被認為特別熱門的網站。推薦網站選自於:
- 推薦網站
- 一般搜尋結果
- 相關網站
一般搜尋結果會顯示您網站搜尋的一般搜尋結果。
- 娛樂、運動、商業和政治新聞的熱門網站。
- 歌手記事和歌曲試聽的熱門網站。
- MSN Encarta 關於百科全書的相關資訊。
- MSN 內容。
- MSN 內容夥伴。
- MSN 廣告夥伴。(Microsoft 接受付費的網站連結)
熱門的搜尋主題:建議相關的主題幫您重新定義您的搜尋。按下其中任何主題將開始新的搜尋並顯示新的搜尋結果網頁。將先顯現最相關或最熱門的主題在「網頁目錄網站」和「網頁」部分,可能有連結的網站擁有者已付費來加速檢視或按選他們的網站。這些網站的排列順序是依據適用於每個部分內所有連結的標準演算法,不會因付費而改變其排列順序。
- 推薦網站:直接連結至來自 MSN.com、MSN 贊助廠商以及最受歡迎的網站連結。
- 網頁目錄網站:在 MSN 網頁目錄內的其他網站。
- 網頁:這些是符合您搜尋標準的其他網站。
相關網站:顯示於「找不到伺服器」錯誤訊息網頁,是與輸入錯誤的網域名稱相符的網站。這些符合的網站來自 MSN 搜尋所有的資料來源 — 列於上方的推薦網站、MSN 網頁目錄和列於下方的 MSN 網頁索引。
MSN編輯以人力製作名錄, 碰到不足以應付時, 先取用來自Looksmart名錄的資料, http://www.looksmart.com/, 以軟體篩選適合的結果, 呈現給使用者。
更複雜的搜尋, 祗有靠軟體爬梳出來的資料庫, Inktomi http://www.inktomi.com/, 也可以點選 進階搜尋(Advanced Search), 直接取用Inktomi的資料。
MSN在自製的名錄之外, 還引用外來的名錄及軟體產生的資料庫。
網擎資訊軟體股份有限公司 Openfind Information Technology, Inc. 創立於1998年1月,係結合國立中正大學資工所吳昇教授所領導之 GAIS 研發團隊,及網際網路業精英所組成。
自成立以來致力於網際網路之基礎技術,包括搜尋引擎、網頁式電子郵件﹝WebMail﹞與網路社群機制之開發;知名入口網站如 Yahoo(雅虎)、Kimo(奇摩站)、Sina(新浪網)、HiNet(中華電信)、SeedNet(數位聯合)、PC Home(網路家庭)、微軟MSN、中時電子報等均先後成為 Openfind 的合作夥伴。
2000 年網擎進軍大陸,更爭取到聯想 FM365 及 Lycos 等入口網站採用 Openfind 產品及服務;同年亦正式踏入日本市場,推出企業用搜尋引擎,透過日本地區總代理積極開拓市場,迄今已獲得超過 150 家日本知名企業的肯定,為網擎國際化跨出了成功的一大步。
Openfind 的搜尋引擎向來以處理大量資料能力著稱,現階段在華文網站,尤其是大型網站中有重要的市場地位,而在搜尋引擎背後支持它順利運作的便是此一核心套件。
在功能面上不但能提供同音、容錯、同義、布林檢索、中英文片語查詢等全文檢索的能力,只要將各式各樣的資料源轉換成簡單的 Record File 格式後,即可立即透過 Openfind 搜尋引擎核心套件的幫助,迅速建構出滿足實際需要的搜尋服務。
CD2000 提供的高品質華文分類目錄百科索引,是所有的華文讀者都需要的網路服務。這個產品,對以下三種客戶都很適用 :
華文相關入口網站:透過網擎所提供的高品質華文分類目錄百科索引,網站經營者將可吸引更多的讀者,帶來更多流量。對於現在已有分類目錄的經營者,我們也提供移植的功能,可保存現有的目錄內容,以確保過去的投資。
華文相關垂直網站:網擎 Openfind 華文分類目錄百科索引可針對垂直網站的需求,提供部份內容給客戶,以節省客戶自行建置目錄服務的投資。同時,華文百科索引的彈性分類結構,也有助於依客戶要求作不同形式分類。
有大量資訊的內容提供者:人工輔助的分類目錄是提供大量資料查詢,最有效的工作之一。Openfind 的 CD2000 分類引擎,使用電腦輔助的分類架構,可在更低成本內,提供更高品質的分類結果,較傳統的人工分類,效率可以好上數倍。
提供幾種搜尋的方法:
網站資料庫不夠時, 自動轉由Google提供網頁查詢服務。您也可以藉由點選「相關網頁」或是下拉選項選擇網頁蒐集,指定由Google進行搜尋。
- 網站 - 蕃薯藤以人工方式自行編定的主題名錄
- 網頁 - 取用Google的軟體編製資料庫
- 新聞 -
- 股市 -
- 期刊 -
- BBS -
- 商品 -
- 活動 -
搜尋精靈提供您不同的搜尋網站方式。
1.蕃薯藤分類瀏覽、網站搜尋 - 完整的分類瀏覽、網站查詢,並提供活動、新聞、股市等綜合檢索。即蕃薯藤的首頁, http://www.yam.com/
2.兒童網站查詢 - 蕃薯網站提供,精選國內優質網站,著重兒童的學習,與親子成長。http://kids.yam.com/index.html
還有一些網站還不錯, 可惜不支援中文, 而且也有點鈍鈍的。
創立於1994年, 最早的搜尋引擎之一, 1999年四月以來, 不再於網路上爬梳新資料, 採用FAST公司的資料庫。檢索結果的相關度及完整性, 完全等同於AllTheWeb, 即使如此, 它還是有些特色, 值得使用者重視。
- 相關字詞(Refind Area), 出現在搜尋結果的最上欄。
- 廣告網站(Sponsored Search Listings), 廠商付費, 讓它的網站排名在前, 與Overture配合。
- 自有資料庫(From the Lycos Network), 來自1999年4月以前的資料。
- 外來資料庫(Web Results), 取自FAST公司的資料。
- 分類名錄(Categories), 查詢的資料屬於那些類別。
- 其他建議(Second Opinion), 還可以去別的地方查資料。
成立於1998/1999年間, 以自然語言查詢聞名, 隨手問個問題, 就會有看來相關的答案。
其實, 在它背後, 曾有百來位編輯辛勤的工作, 在網際網路世界裡, 到處巡遊, 把對應的網站一一建立起來。現在已減少到10位左右編輯, 還是以人工方式運作, 非常適合剛開始上網的新手。
檢索結果最後, 還列出別人問過的相關問題, Other people with your search have also asked, 讓使用者參考。
另外, 還採用Teoma(http://www.teoma.com/)爬梳出來的資料庫, 做為補充。檢索的結果有三項回應: 相關網頁(Results)、縮小範圍(Refine)、專家建議的相關資源(Resources); 採用Subject-Specific Popularity排序法, 依照同主題網頁參照的次數, 決定該網頁的權威性。付費取位置, 則使用Google的AdWords。
會員採用America Online 6.0上網包, 非會員則需使用Microsoft Internet Explorer。
採用Google爬梳的資料庫, 所以它的檢索結果與Google的檢索結果是雷同的。AOL的會員, 使用內部網路時, 可以取得若干會員獨享的全文; 如果, 不是會員, 何必那麼費事, 直接用Google即可。
具有潛力的網站, 不能掉以輕心, 值得注意。
Ask Jeeves於2001年九月買下這個搜尋引擎, 它不以容量取勝, 雖用軟體自動產生資料庫, 但它的容量祗有Google、AllTheWeb.com、Inktomi、AltaVista等搜尋引擎資料庫的十分之一左右。2000年問世以來, 它以相關度(relevancy)精準而著稱。
它以3R著稱, 一次檢索, 取得三份資料:
- 結果/Results - 相關的網頁
- 精煉/Refine - 縮小查詢範圍
- 資源/Resources - 取得專家學者的資源
2001年問世, 就受到矚目, 以精準的相關度自許, 資料庫的容量絲亳不遜於Google、AllTheWeb、Inktomi等搜尋引擎的資料庫。不過, 從2001年六月以來, 它的資料庫就不曾更新過, LookSmart是它的業主, 承諾在2002年末, 更新它的搜尋引擎。
搜尋引擎公司單純提供資料庫給其他的公司, 本身並不期望有終端使用者, 用它們的資料庫。
這家公司非常特別, 銷售搜尋引擎給其他公司, 但是本身不提供搜尋網站, 讓終端使用者操作, 它自己的網站祗讓使用者搜尋公司的資料, 完全沒有試用其產品的機會。它是唯一隱身幕後的夥伴, 不會與客戶爭寵, MSN一定對此很滿意。
原來是柏克來加州大學的實驗搜尋引擎, 1991年成立公司, 同年中就有第一個客戶, HotBot, jp
是次老牌的軟體搜尋引擎。
在完整性方面, 略遜於Google與AllTheWeb一籌, 聽說2002年夏季後, 會有明顯的改善。
人工編製的主題名錄, 本身有網頁, 卻做得很陽春, 希望使用者不要用它的網站。
付費的商業性網站, 可以排名在前, 有點像是分類電話簿。另外有一個志工編製的名錄, Zeal - http://www.zeal.com/, 免費列入各種網站, 分別列在LookSmart裡, 不會重覆。
另外, 還有一部份是來自Inktomi。
LookSmart成立於1996年十月, 由讀者文摘支持一年, 然被公司的執行長買下。
純志工編製的主題名錄, 1998年六月成立, 同年11月, 被美國線上時代華納擁有的網景公司買下, 在開放授權的條件下, 任何人都可以取用其資料。
Open Directory的首頁可以讓使用者檢索, 卻不鼓勵這種事發生, 做得很簡陋, 類目下的資料祗是依字母排序。必須到主題名錄裡, http://directory.google.com/, 才能做真正的網頁(Web)、影像(Image)、群組(Usenet)及主題名錄(Directory), 檢索的結果才會依使用頻率排序, 稱為PageRank。
原名GoTo, 2001年底改名為Overture。它的特色是, 廠商付費就能爭得好排名。
碩果僅存者, 還有足夠的人潮. 或者被若干人視為重要的, 其實, 它們都已過氣了, 不再居於關健地位。
1995年12月成立, 是最早的軟體搜尋引擎, 後來被Google取代; 結果以相關度排序, 深受使用者喜愛。
1998年該引擎轉型為入口網站的過程裡, 流失很多客戶, 不但結果的排序相關度降低, 而且更新率及涵蓋率都不如其他搜尋引擎的資料庫。
後來, 又回到專業搜尋引擎的領域, 不過, Google、AllTheWeb已經迎頭趕上, 祗能算是市場排名第三的產品。
它的影像搜尋仍是一級棒, 影片與聲音剪輯的搜尋很不錯, 新聞搜尋也是很有看頭。
曾經屬於迪吉多公司, 又歸併入康柏, 現在被分割出來, 由CMGI控制。
1996年五月公開時, 採用Inktomi的資料庫, 曾經造成萬人空巷, 它的色彩及版面配置, 令人印象深刻。
它的沒落要從1999年採用Direct Hit資料庫說起, 它的品質不佳, 被Google擊敗, HotBot也跟著走下坡。
Lycos於1998年10月, 併購Wired Digital時, 一併取得HotBot的經營權,1999年及2000年, 它的重心放在經營入口網站, 忽略了蒐尋引擎的使用者。直到2001年底, 才驚醒過來, 再次回到搜尋引擎的本業, 優先次序仍以Lycos為先。
被美國線上時代華納擁有的網景公司, 它的首頁還是入口網站的樣子, 在網站檢索的框框裡, 有六個搜尋引擎可以選擇:
- AskJeeves
- LookSmart
- Lycos
- Netscape Search
- Overture
Netscape Search, http://search.netscape.com/, 用了Google的資料庫, 所以, 有什麼理由讓使用者不轉投入Google的懷抱呢? 若干Netscape特有的資料, 會出現在最前端, 而且它的介面與感覺也比較親切。其他搜尋引擎, 知名度不高, 但仍可用
舊名為Mining Company, 提供各個領域導覽式的原始內容, 它不算是真正的搜尋服務, 除了本身的資料外, 絕大多數的連結都是對外的。有點像圖書館的參考服務。
就是大英百科全書的網路版。
2001年12月以前, Excite自有軟體在網路爬梳資料, 後來才採用外來的資料庫, 廣告網頁來自Overture, 網路搜尋的資料庫則來自Inktomi。
1995年底公開之後, 聲勢扶搖直上, 1996年11月上網的WebCrawler與1996年7月上網的Magellan, 始終無法趕上。到了2001年4月, Magellan結束營業, 退出市場。2001年11月, Excite被InfoSpace併購, 該公司同時擁有Dogpile與MetaCrawler這兩個同步蒐尋引擎。
1999年秋季公開, 它的付費廣告網站來自Overture, 軟體爬梳的資料庫來自Google。
除了澳洲(.au)與紐西蘭(.nz)的網站資料外, 它的資料庫也涵蓋全球。
基本上, 就是Excite的翻版, 原來是華盛頓大學(University of Washington)的一個研究計畫, 1994年4月20日開始服務, 是個獨立的公司, 1995年3月被美國線上買下, 1996年11月再被它的對手Excite買下。
採用FAST的資料庫。
點選式檢索, 需要稍為讀一下它的介紹, 才會用, 很有趣的經驗。
主題名錄, 輕鬆地上傳自己的資料。
主題名錄。
社區型的搜尋引擎, 由志工完成。
1998年6月以NewHoo之名公開, 1998年11月被Netscape取得, 以開放授權的方式, 讓任何團體或個人都能使用它。Netscape是第一個取得授權的單位, Netscape擁有的美國線上、Google、Lycos等搜尋引擎, 也使用它。
志工編製並評鑑網站, 由LookSmart擁有, 並且放在LookSmart的非商業性範圍裡。
以Open Directory為基礎, 原名為Wherewithal, 2001年中才改現名。
搜尋引擎列表
搜尋引擎, 主題名錄與入口網站列表
毛慶禎
臺北縣新莊市輔仁大學圖書資訊學系
Tel: 02 29031111 ext 2334, 3244(研究室) - Fax:
02 29017405
E-mail: mao@blue.lins.fju.edu.tw
http://www.lins.fju.edu.tw/mao/internet/majorsearchengines.htm