書內檢索

毛慶禎 輔仁大學圖書資訊學系副教授
http://www.lins.fju.edu.tw/mao/works/fulltextsearch.htm
2004/12 for PCOffice

2004年10月7日, Google宣佈擴大Google Print[印本檢索]的測試範圍, 協助出版商在網路上銷售圖書, 也為使用者提供檢索印本全文的機制。不同於2003年12月初, 靜悄悄推出的Google 印本檢索測試版, 這次大張旗鼓的動作, 背後的意義值得業界及圖書館界玩味。

一年前的10月23日, 亞馬遜推出Search Inside the Book[書內檢索]。讓任何人搜尋12萬本書3,300萬頁的內容, 檢視內含搜尋字詞的實際書頁。

Google印本檢索或亞馬遜書店的書內檢索, 將改變出版商和書店的關係, 讓出版商有機會直接面對讀者。

出版商意圖擺脫書店控制, 尋找把圖書直接賣給讀者的銷售模式, 已有相當時日。大多數讀者不會注意出版商的新書, 也不會到特定的出版商網站查詢, 祗會在書店的網站查詢。亞馬遜的書內檢索及Google的印本檢索, 藉著調整檢索方式, 改變讀者使用圖書的習慣。

--------------
Google印本檢索
--------------

在Google印本檢索的首頁輸入鍵詞, 除了搜索數十億的網頁外, 還可搜尋參與該服務的書籍全文, 不但允許讀者閱讀部分的內容, 也連結到出版商或網路書店, 方便讀者即時購書。

出版商將樣書提供給Google, Google把內容掃描, 再做字元辨識, 納入資料庫。經由檢索結果, Google提供網路銷售的鏈結, 讓讀者直接購買該書。

包括牛津大學出版社在內的多家知名出版商, 己經和Google簽約, 陸續建立資料庫。

--------------
亞馬遜書內檢索
--------------

2003年10月23日, 亞馬遜推出書內檢索, 有12萬本圖書3,300萬頁的內容, 供讀者自由檢索, 並讓讀者檢視鍵詞所在的頁面及其前後各兩頁。

已有190家出版商把他們的圖書攤在網路上。為了避免法律上的爭議, 亞馬遜採取若干步驟, 讓讀者難以在網路上閱讀整本書, 並封鎖列印的功能。

然而, 這些限制太淺顯了。以多個帳戶反覆搜尋, 讀者就能檢視超過五頁的內容; 以螢幕擷取軟體, 就能把書頁列印下來, 一點也不困難。

從前, 祗能根據書名、作者或鍵詞檢索書籍, 檢索結果只有書名、著者、標題等書目資料。不過, 「書內檢索」的結果, 可顯示鍵詞的頁面, 顯示鍵詞在書內的其他連結並瀏覽相關的摘要。

------------
圖書館的挑戰
------------

幾千年來, 圖書館學的技術祗能對書目資料檢索, 從來不曾思索對圖書的全文檢索可能, 莘莘學子必須努力背誦記憶, 把寶貴的時間耗在無窮盡的尺牘裡, 無力抬頭走出書堆, 思考更深層的學理。

Google的印本檢索及亞馬遜的書內檢索, 使用存在已久的掃瞄及字元辨識技術, 將徹底改變學習的模式; 同時, 對現行的智慧財產權觀念, 也是嚴重的衝擊。

順著科技的發展, 激動人類的潛能; 或被既得利益者用法律框住, 強化並固定既有的社會落差。這是我們面對的必然抉擇。

參考資料

Creative Commons License
採用Creative Commons授權條款 姓名標示-相同方式分享