|
檢索引擎:
- 反向索引檔:索引單字詞、雙字詞(索引檔大小: 140%)
- 單一階段檢索,速度快、結果完整(相較於 signature file)
- 英文以停用字表、詞幹法(stemming)處理
- 向量檢索模式:容錯、近似自然語言
關鍵詞擷取
- 統計分析法:運用最少的計算資源(曾元顯 1997a,1997b,
關鍵詞自動擷取技術與相關詞回饋)
比較:
- 詞庫比對法:詞庫需持續維護更新(大部份國內廠商的作法)
- 文法剖析法:需完整的文句,擷取出的名詞片語需進一步篩選
(適合作為關鍵詞的名詞片語少於 50% , Arppe 1995)
|