網路資源的類型

毛慶禎 輔仁大學圖書資訊學系副教授
http://www.lins.fju.edu.tw/mao/internet9303.htm, 2004/3/1
  1. 入口網站
  2. 資源類型
  3. 查詢途徑
  4. 網路運作
網路指的是網際網路, 資源的類型則沒有共識, 入口網站是很好的起點, 圖書館也會自訂網路資源的連結, 每個人自訂的網路書籤是最客製的網路資源。

入口網站

入口網站 (portal site) 是1998年興起的觀念,扮演進入網際網路大門的角色,使用者經過這個入口進入網際網路的世界。搜尋引擎、主題名錄、最新消息等,基本的功能一項都不能 少,至於免費的電子郵件、網頁空間、mailing list等,也逐漸成為主流。

在較流行的入口網站,有:

  1. 雅虎臺灣 http://tw.yahoo.com/
  2. 蕃薯藤 http://www.yam.com.tw/
  3. 奇摩 http://www.kimo.com.tw/index.shtml
  4. 新浪網 http://www.sina.com.tw/
  5. MSN 臺灣, http://www.msn.com.tw/homepage.asp 
  6. 網路家庭 (PC Home) http://www.pchome.com.tw/

  1. 中華網, http://www.china.com
  2. 新浪網, http://www.sina.com.cn/ 
  3. 搜狐, http://www.sohu.com/ 
  4. 網易, http://www.163.com/ 

  1. AOL, http://www.aol.com/ 
  2. MSN, http://www.msn.com/ 
  3. NBCi - http://www.nbci.com/
  4. Yahoo! - http://www.yahoo.com/

瀏覽器裡有一個首頁的設定,每次開機時,先進入該首頁,入口網站的目標就是成為每個人瀏覽器裡的首頁。

入口網站的使用率較高,廣告效益也最大,投入這個行業的人愈來愈多;網路服務商提供給用戶的安裝程式,通常將瀏覽器的首頁設為該網路服務商的首頁。

祗要加入會員,填寫資料,付出個人的部份隱私,就可以享受多項服務。

水平入口網站 (horizontal portal) 指的是一般入口網站,沒有特定的目標,以一網打盡為原則。

針對特定網民的垂直入口網站 (vertical portal),把相關的網頁緊密結合在一起。

入口網站的評比標準:

  1. 到達率 reach
  2. 網頁瀏覽率 pageviews
  3. 會員數 member
  4. 頻寬 bandwidth

1990年代的第一代網路調查公司, iamasia、Media Matrix等, 以網域名稱為追蹤權本; 1995年的第二代網路市調公司,  Nelson等, 以Proxy為偵測對象; 2000年的第三代網路調查公司, NetValue、NetMeter等, 直接測量 TCP/IP 下運作資料。

根據法國NetValue公司的研究, 現在的網路行為裡, 46%為ICQ、電子郵件等即時通訊服務。

iamasia公司採用內建於電腦系統的網路行為評量軟體技術(System-level Metering Technology), 可以更進一步的抓到使用者以暫存檔(cache)閱讀網頁的行為。

根據NetValue的資料, 家庭網路用戶於15-24歲佔35.4%、25-34歲佔19.8%、35-49歲佔37.1%; 不過一般的評量資料均顯示25-34歲才是網路成熟族群(heavy user)。

然而, 網路調查公司與入口網站掛勾的情況, 非常嚴重:

  1. NetValue與奇摩
  2. iamasia與蕃薯藤
  3. SuperPoll與網路家庭

資源類型

輔仁大學圖書資訊學系做了229個連結, 認定的網路資源:



休 閒生活 (5)

政 府機關 (44)
內政 部, 交通 部, 行政 院, 法務 部, 省市 政府及議會, 財政 部...

校 內資源 (22)
文圖, 社圖, 法管 電算中心, 理外 民電算中心, 理圖, 輔大 圖書館...

財 經工商 (45)
工業 局, 行政 院主計處, 商業 司, 經濟 部

期 刊報紙 (27)
人文 社會類, 中央 通訊社, 中時 電子報系, 財經 金融類, 電腦 資訊類

搜 尋引擎 (12)

電 腦資訊 (31)
軟體 資訊, 軟硬 體公司, 硬體 資訊, 電腦 雜誌與出版社

學 術文教 (43)
文教 單位, 學術 單位

國家圖書館認定的網路資源是:

  • 電子報刊電 子報刊
  • 光碟資料庫光碟資料庫
  • 專業學會試用資料庫
  • 研究機構專業學會
  • 研究機構研 究機構
  • 研究機構留學資訊
  • 查詢途徑

    使用者自行在網際網路上找尋資源, 有數種查詢途徑。

    搜尋引擎

    網際網路的成長速度, 非常快速, 以指數性成長尚難以形容它。Google自稱可搜尋 3,307,998,701 頁的網頁。

    當網際網路的資料量還不是很大時, 以人工編製資訊入口, 或以若干軟體, 用指令方式, 就可應付使用者的需要。當 Achie、Gopher、Veronic等資料成長後, 既有的方式顯示不合用。

    當初編製的檢索工具, 沒有採納圖書館學的技術, 布林邏輯、接近搜尋、萬用字元、切截字等檢索技術, 完全闕如。祗是鍵入關鍵字, 讓搜尋引擎自己去找。

    圖書館的編目分類有數種方法, 網路資源的檢索也有多種途徑。本課程先說明搜尋引擎的各種類型, 及其優缺點, 接著再介紹若干具有特色的常用搜尋引擎。

    以俗稱蜘蛛精或爬蟲的程式, 在網路上自動抓回資料,構建的全文型搜尋引擎, 以Google及Openfind的知名度最高。

    人工方式自行建立的名錄型搜尋引擎, 以Google Directory、Yahoo! Directory、LookSmart、Open Directory的知名度較高, 中文的領域裡, 以雅虎奇摩、PCHome的使用者較多。

    鍵入自然的句子, Which gases are partially soluble in water?, 自然語言搜尋引擎就能幫你檢索, 順便做單字及文法的檢查; 這個領域的產品很少, Ask Jeeves是最有名氣的, 沒有中文的產品

    這種搜尋引擎最多, 但是使用者也最少, 或許是沒有宣傳的關係。祗針對一種資源檢索, 聖經、佛經、字典、百科全書等。不過, 這些引擎實在太繁瑣了, 難以逐一列舉。2001年元月上場的維基百科(Wikipedia) 是其中之一, 2003年10月2日有161844條英文款目, 中文款目少許。 

    專業搜尋引擎(specialty search engines)/垂直搜尋引擎(vertical search engines), 完全不同於一般性的搜尋引擎, 祗針對特定領域, 做深入的搜尋, 圖書資訊專業人員或研究人員對此較有興趣。

    商用資料庫

    1978年, 臺灣的圖書館引進商用資料庫, 稱為「國際百科檢索服務」,源自英文 UDAS (Universal Database Acess Services), 利用電腦與國際衛星通訊設備,檢索資料庫中的主題資料,即時傳送給使用者的服務。常 用的國外資料庫檢索系統有 DIALOG (由 Knight-Ridder Information,Inc. 提供)、ORBIT(由 System Development Corp. 提供, 改名為Questel.Orbit)、BRS (由Bibli Retrieval Service)、DRI(Data Resources,Inc., 改名為Global Insight)以及日本的JOIS等。

    利用線上資料庫的最大好處,是其包括的資料庫類別多,涵蓋的年代較早, 因此每一種資料庫的資料量,都比光碟豐富而且新,可彌補光碟之不足。收錄的類型與學科很廣泛:

    商用資料庫的發展與電子商務有密切的關係, 出版商努力提供加值服務。

    虛擬圖書館及資訊入口

    搜尋引擎提供的服務, 改變資訊服務的本質, 找到太多的資料, 卻無法驗證其價值或權威性。圖書館等機構重新思考人工編製網際網路目錄的必要性, 經由專業館員的篩選, 挑出具有權威性、新穎性、信任性、可用性的資訊。

    虛擬圖書館重新建立圖書資訊在網際網路時代的角色。

    智慧代理人

    搜尋引擎、商用資料庫或虛擬圖書館有共通之處, 使用者必須到訪, 才能找到資訊。使用者從伺服器拉取需要的資訊, 對於急需新知的使用者而言, 有點緩不濟急。

    智慧代理人自動搜尋網路上最新資訊並提供彙整過濾, 將資訊透過E-mail傳送到您手上。有了智慧代理人, 不需要親自上網到每個新聞網站一一查詢,只要自訂關鍵字,選定新聞來源,即可掌握您鎖定的訊息。

    智慧代理人接受使用者事先的設定, 主動在網際網路找尋資訊, 然後送交給使用者。

    電子郵件的延伸

    網際網路是人與人的溝通管道, 電子郵件是最早期的工具, 新聞群組與郵寄名單是網際網路上很古老的工具, 它的外觀不夠炫麗, 容易被忽視, 不過, 仍是很棒的溝通平台。視訊會議及網路電話的技術已逐漸進入市場, 成為玩家的最愛。

    網路的運作

    從使用者的立場來看, 網際網路由兩件事構成:
    1. TCP/IP 通信協定
    2. Domain Name 網域名稱

    TCP/IP

    TCP/IP是 網際網路 (INTERNET) 主要的通訊協定 (PROTOCOL), 也可使用來作為區域網路 (LAN) 的通訊協定. 事實上由好幾種通訊協定與服務所構成:1. IP : 基本的無連結 (CONNECTIONLESS) 資料傳送.2. TCP : 建立連結導向 (CONNECTION-ORIENTED) 的資料傳輸.3. ICMP : 傳輸控制與管理的資訊.4. ARP/RARP : 在區域網路 (LAN) 的 DATALINK 層做 IP 與 MAC 的轉換.5. UDP : 加上來源與目的 SOCKET IDENTIFIER 的無連結資料傳輸.6. TELNET : 遠端登錄的終端機 (TERMINAL) 模擬程式.7. FTP : 檔案傳輸.8. SMTP : 電子郵件 (E-MAIL) 資訊交換.9. DNS : 網域名稱 (DOMAIN NAME) 服務.10. NFS : 網路檔案服務。

    TCP是Transmition Control Protocol的縮寫, 指的是傳輸控制通信協定; IP是Internet Protocol的縮寫,指的是網際網路定址的通信協定。

    TCP 與 IP 為 TCP/IP 中主要的傳輸控制協定, IP 負責封包 (PACKET) 的傳送接收等無連結 (CONNECTIONLESS) 工作, TCP 負責建立連結導向 (CONNECTION-ORIENTED) 的通訊, 意思是在傳送資料前, TCP 會建立一個有效的連線, 並使用錯誤檢查等方式確保資料能夠正確無誤的傳送, 如果發生錯誤, TCP 會自動嘗試重傳資料, 而 IP 只是單純的發送資料封包, 並不確認資料是否正確送達.TCP 事實上使用 IP 來建立連結, 並用 IP 來傳送資料與作為兩台主機 (HOST) 之間的確認資料傳輸等動作。

    IP負責傳送資料 (DATAGRAM) 到指定位址, 但不確認資料是否正確傳達, 是一種無連結 (CONNECTIONLESS) 的通訊協定. IP 使用的目的地辨識方式是對每一個網路 (NETWORK) 及每一台主機 (HOST) 給予一個 ID, 合併稱為 IP ADDRESS.目前的 IP 版本稱為 IPV4, 稱為 IPNG 的 IPV6 正在發展中。

    IP Address  Network

    TCP/IP 網路 (NETWORK) 上辨識一個節點 (NODE) 所使用的 32 位元 (BIT) 數字系統, 由網路識別編號 (NETWORK ID) 與主機識別編號 (HOST ID) 所組成, 依照 NETWORK ID 與 HOST ID 使用的位元數不同, IP ADDRESS 能分配的數量為:1. CLASS A : 127 個網路, 每個網路有 16 個百萬的主機.2. CLASS B : 16000 個網路, 每個網路有 65000 個主機.3. CLASS C : 2 個百萬網路, 每個網路有 254 個主機.使用這個方式分配導致很多可用位址被浪費, 新版的 IPV6 打算使用 CIDR 編碼方式來取代.

    Class Leftmost bits Start address Finish address
    A 0xxx 0.0.0.0 127.255.255.255
    B 10xx 128.0.0.0 191.255.255.255
    C 110x 192.0.0.0 223.255.255.255
    D 1110 224.0.0.0 239.255.255.255
    E 1111 240.0.0.0 255.255.255.255

    有兩種IP Address在運作: IP version 4 (IPv4) 及 IP version 6 (IPv6)。IPv4從1983年元月 開始運作, 是目前的主流, 它是32位元的二進位系統, 分為四組, 各八個位元, 以十進位的方式運作, 如140.136.85.1; IPv6從1999年開始運作, 它是128位元的二進位系統, 分為八組, 各八個位元, 以16進位的方式運作, 如1080:0:0:0:8:800:200C:417A。

    IPv4

    用來識別網路上的節點,並指派路由資訊。網路上的每一個節點都必須被指派一個唯一的 IP 位址,這位址是由網路識別碼、加上由網路系統管理員所指派的唯一主機識別碼所組成。這種位址通常是以帶小數點的十進位數字方式所呈現,每一個八位元字元組 有一個十進位數值,而由句點分隔開這些數值(例如 : 138.57.7.27)。

    IPv6

    隨著網路的快速成長, IPv4的定址空間很快地就不夠用了, 雖然世界各大主要網路機構都已嚴格管控IP核發數量, 但經由ISP切割給用戶網段所造成的部份IP損耗也相當可觀, 據估計至2005--2010年即可望耗盡. 為了有效解決IPv4不足的狀況, IETF提出了新一代的 IP協定, 由於是第六版, 因此也稱為 IPv6, 具有 128bit定址範圍, 也就是 2 的 128 次方. 尤其手機行動上網, 更有待IPv6相關建置計劃的付諸實踐. 亞洲地區因進入Internet的時間較晚,分配到的IPv4數量遠遜於美國, 而日韓中國則已投注大量資源發展相關研發, 並已申請到相當多的IPv6位址. (詳見www.apnic.net)

    台灣地區目前分配到的有 :
    中華電信(HINET) 2001:0238::/32
    台灣學術網路(TANet) 2001:0288::/32
    中央研究院(ASCC.NET) 2001:0c08::/32 (2002.07)
    台灣電訊(TTN) 2001:0c50::/32 (2002.08)
    中華電信研究所(CHTTL)2001:0ca0::/32 (2002.10)
    數位聯合(Seednet) 2001:0cd8::/32 (2002.12)

    Domain Name

    一種 INTERNET 的服務, 將網域名稱轉換成實際上的 IP 位置.由於網域名稱 (DOMAIN NAME) 較 IP 位置的數字容易記憶,所以大部分時間參考網域或主機時使用網域名稱加上主機名稱 (HOST NAME),但實際上 INTERNET 的運作是使用 IP 位置,DNS服務會將其轉換,例如輸入 www.lins.fju.edu.tw 在瀏覽器的位置列時, 網路系統程式會要求 DNS主機將名稱作轉換而求得 140.136.85.1 的 IP 位置.理論上所有 DNS主機之間以相互查詢的方式求得轉換資料,系統只要指定一個 DNS主機就夠了,但是當無法連接上系統指定的 DNS主機時,網域名稱將無法轉換,所以可指定一個以上的 DNS主機,系統可依指定查詢順序尋找 DNS主機服務。

    透過各地的 Whois 資料庫,可以互查網域名稱與IP Address。


    參考資源

    1. TWNIC Whois Database, http://whois.twnic.net.tw/

    自我檢測

    1. 入口網站有那些功能? 分別就中文及英文入口網站實地體驗說明之。
    2. 資源類型應如何分類? 舉例說明之。
    3. 請查這個IP的內容 61.229.221.95; 請查 twnic.net.tw 的內容。

    おw,可以互查網域名稱與IP Address。


    參考資源

    1. TWNIC Whois Database, http://whois.twnic.net.tw/

    自我檢測

    1. 入口網站有那些功能? 分別就中文及英文入口網站實地體驗說明之。
    2. 資源類型應如何分類? 舉例說明之。
    3. 請查這個IP的內容 61.229.221.95; 請查 twnic.net.tw 的內容。