圖書館基礎研習班 中國圖書館學會 |
毛慶禎 |
網際網路是一種電腦網路, 以TCP/IP通訊協定互相連線, 形成的虛擬網路, 用以互通信息, 互傳資料與共享各類資源。
毛慶禎編譯的Internet發展史, http://www.zakon.org/robert/internet/timeline/HIT-big5.html
1969年9月2日是網際網路的生日, 1969年10月20日美國UCLA和史丹福大學連線, 打算從UCLA這邊鍵入 log 三個字母, 然後由史丹福那邊加上 in, 形成 login, 第一個字母順利被對方收到, 鍵入第二個字母後, 系統當機。
以軍事用途起家,現在則以民用為主。
網際網路的本質是:
理論上, 可以同時上網的電腦數量沒有限制, 實務上, 現在的極限是約43億部(4,294,967,296)電腦, 可預見的將來是不夠用的, 研發中的技術將可容納2,814,749億部(281,474,976,710,656)電腦。
/========\
IP Address
\========/
現在的 IP Address (Internet Protocol)是 IPv4 (IP Version 4), 以32位元來表示位址, 而每8個位元 (bit)為一個位元組 (byte), 所以十進位使用4個小於256 (2的8次方)的整數來表示。因此IP位址是介於0.0.0.0到255.255.255.255之間, 如果你看到IP中任一個數字超過255, 或有五個數字, 表示那個位址是騙人的。
二進位 |
10001100 | 10001000 | 01010101 | 00000001 |
---|---|---|---|---|
十進位 |
140 | 136 | 85 | 1 |
寫法 |
140.136.85.1 |
由於網際網路的快速發展, 使得全世界的IP位址發生短缺的現象, 因此就有人提出了所謂的IPv6試圖來解決IP短缺的問題。
此外, 127.0.0.1通常用來表示當地端電腦 (local host), 即使用者目前所在的電腦。正因為IPv4只使用32位元, 所以它所能容納的結點數目只有2的32次方個 (約43億), 這顯然無法滿足未來的需求。所以就有人提出IPv6, 它使用128個位元來表示, 是IPv4的2^96倍之多。此外, IPv6還改進了許多IPv4的缺點, 以提升網路傳輸的效率及安全性。
/========\
網址
\========/
網址(Domain Name)是一連串的文字,對應到網路上的實際位址(IP Address)。
但如果在每次連線時都必須輸入IP位址的話, 對人類的記憶而言實在是很大的負擔, 畢竟www.pchome.com.tw比203.70.70.15好記得多。但對電腦而言, 它們只認得0與1, 因此就必須有伺服器將www.pchome.com.tw解釋成203.70.70.15, 這部伺服器就稱為DNS (Domain Name System; 網域名稱系統)伺服器。
把140.136.85.1視為數字型IP位址, blue.lins.fju.edu.tw當成文字型IP位址, 數字型給電腦用, 文字型給人腦看, 再以網域名稱系統伺服器居間轉換。
blue | 行政用主機 |
lins | 圖書資訊學系的縮寫 |
fju | 輔仁大學的縮寫 |
edu | 教育單位 |
tw | 台灣的地區代碼 |
所以在設定撥號網路時, 如果沒有正確設定好DNS伺服器位址, 就可能發生無法開啟任何網站的現象, 因為你在瀏覽器中輸入的是網址, 但電腦找不到DNS伺服器去解釋成IP位址, 所以就無法進行連線。但如果你輸入的是IP位址, 卻又沒有任何問題了。
網域名稱的最後一組, 即上層網址(top leve domains, TLDs), 由ICANN(Internet Corporation for Assigned Names and Numbers)指定, 不可以自行選定, 分為八大類:
字首 | 性質 |
---|---|
.com | Commercial, 公司行號等商業單位 |
.edu | Education, 教育單位, 學術團體 |
.org | Organization, 非營利性團體 |
.mil | Military, 軍事單位 |
.net | Network, ISP等網路服務單位 |
.gov | Government, 官方單位 |
.int | International, 國際性組織 |
.tw | 國家代碼, 香港(hk), 日本(jp), 芬蘭(fi), 英國(uk) |
2000年十月, ICANN再度指定七個上層網址:
字首之後的部份, 再由該字首管轄單位規定, fju是由教育部給定, lins是輔仁大學給的, blue是圖書資訊學系指定的, 其他學校的圖書資訊學系不必用lins。
國家代碼之後, 由各國自行決定, 沒有必要跟隨前述的規範, 英國的公司行號不用com, 而用co, 教育單位是ac, 大英圖書館有獨立的網名, 它的網址是 http://www.bl.uk, 這都是合理的做法。
臺灣的網址管理單位:
.edu.tw 教育部 .gov.tw 行政院研考會 .mil.tw 行政院國防部 .com.tw
.org.tw
.net.tw
.idv.tw交通部委由TWNIC 臺灣網路中心
中華民國網路協會(http://www.ina.org.tw) 成立的「中華民國網路交換中心」
(TWIX), 做為國內各 ISP 的交換中心。另外, 台灣網路資訊中心(http://www.twnic.net)也極積規劃成立「台灣網路交換中心」, 也是另一個交換中心。同時網域名稱的申請採取收費制, 也開放同一單位可申請多個網域名稱, 而以個人名義申請的網域也會考慮開放。有數種中文域名:
現通行於世的網址都以英文為主,但對於非英語國家使用上仍有語言上的隔闔,然而使用 VeriSign 多國語文網址系統,可以支援英文、中文繁簡體、日文與韓文( 2000 年底前將陸續推出),如資迅人網路集團的網址,你可輸入 pAsia.com 、資迅人.com ,或是簡體的資迅人網址都能直接到達資迅人的網站。目前在資迅人申請網址,您可同時申請英文、中文繁體、中文簡體三種網址。
多國語文網址計劃是由全球最大的網址註冊商( Network Solutions,為 VeriSign 旗下的公司)推動的,藉由 VeriSign 的多語文網址技術,透過全球現有的網際網路網址系統,不需更改 DNS 設定或下載任何軟體,即可通行於現今的網路環境。 VeriSign 系統獲得 ICANN (註)的全力支持,而資迅人是台灣唯一獲 ICANN 認可合格的網址註冊服務公司,在 ICANN 強烈支持此全球性網址系統的情況下,將更可保證此系統的可行與發展。
中文網址有點麻煩, 目前有三套系統在運作中, 誰能取得優勢, 當在未定之數。
網路服務商
\==========/
網路服務商(Internet Service Provider, ISP), 登記有案的52家, , http://www.whois.twnic.net.tw/ispbasicdata_index.html
中華電信數據通信分公司, 台灣固網股份有限公司, 數位聯合電信股份有限公司是其中較出名者。
實體線路 - 電話線(56K撥接, ADSL), 光纖, 有線電視
網路機房 - 教育部, 政府網路, SeedNet, Hinet
撥接免費, ADSL為主流, 有線電視最便宜
俗稱全球資訊網(www), 採用HTTP(Hypertext Transfer Protocol)方式傳輸資料。
在Internet上有許許多多各式各樣的試用性公用軟體,有很多具有參考及進一步發展之價值的原始程式。對學生及研究人員來說是個寶庫。Archie Server提供已完整公用軟體之清單,使用者可以很方便的取得所要軟體位於何處及如何取得相關等資訊。
學校/單位 Full Domain Name IP Address Login ID 交通大學 archie.twnic.net 192.83.166.10 archie 中央大學 archie.edu.tw 192.83.166.12 archie
收信伺服器POP3 (Post Office Protocol 3)
送信伺服器SMTP(Simple Mail TransferProtocol)
通常設定電子郵件收發軟體時會遇到SMTP和POP3這兩項設定。SMTP是英文Simple Mail TransferProtocol的縮寫,中文可以翻作「簡易郵件傳輸協定」,是用來將電子郵件傳出去的方法。我們可以將 SMTP想像成郵局的寄信窗口,只要信封上的資料填寫妥當,也貼有足額郵票的話,那信件就可以寄了。同樣的在網際網路上,SMTP是一個軟體,並放置在一部主機中,只要在我們的Email發送軟體中設定SMTP的主機位址,那郵件就可以寄出了。
POP3是英文Post Office Protocol 3的縮寫,它有點像我們在郵局租用的個人信箱一樣,申請之後就會獲得一個信箱號碼,以後只要寄到這個號碼的信件就會存到信箱中,等我們有空就可以去取信。同樣的在網路上,當我們申請了一個帳號之後,我們就會獲得一個Email地址,這等於在Email主機那端開了一個信箱,以後寄到這個地址的信就會存到您的信箱中,因此POP3主機就是扮演收信、管理信件的工作,使用時只要我們提供正確的帳號及密碼,那我們就可以開啟信箱中的信件。所以,在軟體設定時必須將我們信箱所在的主機位址給它,也就是POP3這一項所必須填入的內容。了解了SMTP及POP3之後,是不是覺得電腦的世界跟人的世界很像呢?
FTP Server是目前Internet上公用軟體存放之地點,使用者可透過FTP取得所需之公用軟體。使用者在進入FTP Server尋找軟體前,請先透過中央大學及交通大學所建立之Archie Server,找尋你要之軟體所存放之位址,若已存放於TANet,請不要再到國外抓取。
輔仁大學理工外語民生學院電算中心FTP伺服器服務 http://ftp.svdcc.fju.edu.tw/, 輔仁大學圖書資訊學系檔案服務, http://www.lins.fju.edu.tw/modules/mydownloads/。
Gopher是一個分散式的文件傳送系統,它是由美國明尼蘇達大學所發展而成的,此系統很容易與網路上其他系統連接,諸如Netnews、FTP、Hytelnet、BBS、Archie、WAIS及其他Archie等系統。您可經由Gopher來存取分散在各電腦上的各類資料,就好像這些資料就存在您自己的電腦上。
由於TANet使用者激增及網路資訊之大量增加,相對網路頻寬並未大幅增加,在這資訊高速公路塞車的時候,經由Proxy Server一方面可以節省網路頻寬一方面可以加快您取得資料的速度,對減少TANet骨幹之負擔相當有幫助。
為有效利用對外T1專線頻寬,請使用自動設定代理伺服器(Automatic proxy configuration)的設定,否則無法連至校外。
設定這個 auto proxy 之後,會依你所去的目的地幫你選擇你所需的proxy server,目前的設定是台灣的網點走 proxy.svdcc.fju.edu.tw,而到國外的網點是走 proxy.fju.edu.tw 借此分擔校內 proxy server 提昇效能,不要讓一台 server 的負擔太重, 集中目標,這樣使用 proxy 才會快速。
依搜尋對象的不同,搜尋引擎大致可以區分為四類:
搜尋引擎的資料庫,由蜘蛛精(spider)或爬蟲(crawler)在網路上主動抓出。符合這樣條件的搜尋引擎並不多:
網頁的數量愈來愈多, 以數十億計, 連結更是以百億為單位, 成長的速度超乎想像。搜尋引擎的技術推陳出新, 就是為了面對這種變動劇烈的環境。
Google似乎是集所有的搜尋引擎功能於一身的產品,不過,新一代的小型搜尋引擎正在迎頭趕上。Google有著最大的URL資料庫,往往還能找出非常準確的搜尋結果。該公司甚至已開始獲利了。但是,所有的帝國都將會走向滅亡。
每個人都喜歡用Google,因為它簡單而實用。很多人都在用它,甚至連古巴的Juventud Rebelde這樣的反美網站(西班牙文)也在採用它。
Google有一個重大的缺陷:就是它的搜尋結果太多了,其中大部分都與搜尋主題無關,要瀏覽如此多的結果實在太難了。
因此,目前出現了一類全新的搜尋引擎,試圖提高準確率,或者更好地組織搜尋的結果,以便於瀏覽。
有些搜尋引擎的目標是要打敗Google,成為新的搜尋引擎霸主;還有一些只是希望成為一種具體的研究工具,增加搜尋的深度,縮小搜尋的廣度。
台灣知名的搜尋引擎廠商網擎資訊Openfind,於2002年六月三十日宣佈推出全球最大的網路搜尋引擎,要挑戰世界第一的Google搜尋引擎。
「搜尋引擎是資訊時代最重要的關鍵性技術,台灣如要成功的全面e化必須要徹底掌握此一重要技術根基,Openfind的GAIS30計劃經過了多年的努力,終於開發出足以挑戰世界第一之尖端技術。」網擎創辦人,中正大學資工系副教授吳昇表示,「我們不只在資料量方面突破了鉅量資料處理的難關,一舉將網頁索引數量推升到三十五億頁-Google的1.7倍,更發明了比Google著名的PageRank排序方法更周詳,更優化的『多元排序法(PolyRank)』,以達到更好的搜尋效果!」
網際網路最迷人也最寶貴的特色就是他那超大的知識寶藏,而且這寶藏的規模每年都至少成長兩倍以上,對於搜尋引擎而言,如何有效的駕馭這龐大的資料怪獸與無止盡的倍數成長是一項極為艱鉅的技術挑戰。以三十五億的資料量而言,如果我們把每一個網頁印在一張A4的紙張上,則這些紙接起來的長度足足有100萬公里,可以繞地球25圈。而Openfind搜尋引擎可以讓使用者在一秒鐘之內從這巨大的資料空間裡找到所要的資料!
「在搜尋引擎的競技場裡,資料量是一個很關鍵的因素。資料涵蓋量不夠大就會增加找不到所要資料的情形,而另一方面,搜尋結果的品質也會跟資料量有正向的關係,因為增加挑選的樣本數會更有機會挑到更好的結果。」吳昇博士進一步解釋。
另一方面吳昇博士也指出,目前搜尋引擎利用網頁連結統計來做排序的主要依據有一些缺點。比方說,一個相同查詢詞由不同的人來查,得到的排序結果全都一樣,而且使用者無法選擇不同的排序方式。更甚者,由於連結排名統計的結果對於擁有大量符合筆數的查詢而言,其前十名很可能在數個月內幾乎沒有改變,如此可能造成查詢結果單元化與僵化之現象。並可能造成大者恆大,新站難以出頭,資訊壟斷等之不良影響。
相較於Google著名之PageRank排序法,Openfind研發出名為「多元排序(PolyRank)」之排序法,它不只用更大量的連結資訊來做更周全的統計分析,還參考更多項因素來對網頁做評分,諸如關鍵詞在網頁裡的位置、頻率、與內容的吻合度、網頁的大小、時間、網頁的型態、格式…等多項因素。讓使用者可以得到更好的查詢結果。另外,Openfind的多元排序還可以讓使用者用不同標準來排序查詢結果,讓使用者有更多的選擇與掌握。
除了追求搜尋引擎更大、更準的目標外,Openfind搜尋引擎還提供更新之查詢服務,Openfind每天都會更新索引,讓使用者可以搜尋到最新的資料。
「在這些看得見的創新成果背後,其實有一項看不見的關鍵性技術突破- Openfind開發出了超高效率的搜尋引擎核心技術,有了此一技術,我們得以用更少的設備快速地處理更大量的資料。相較於Google需要用到一萬多台Pentium伺服器,Openfind只用七十台Pentium伺服器就做出更大的搜尋引擎,而如果要處理Google目前的查詢量,所需的設備不到一千台。這就如同在現實世界裡我們做出了馬力更強大的引擎,而耗油量卻只要十分之一!」吳昇表示。
「我們很高興在搜尋引擎技術領域有重大的突破,我們將正式進軍全球,挑戰Google、挑戰世界第一,我們希望為台灣在網際網路的世界裡開創一片新天地!」
在眾多搜尋引擎裡, 還是有一些較為熱門的:
「布林運算式」查詢法是利用布林運算式(Boolean Expression)連結兩個或兩個以上的關鍵字,將您要查詢的範圍加以縮小或擴大,使檢索出來的結果更加符合您的需求。
/=======\
交集 and
\=======/
AND,表示交集,不拘大小寫,也可用半形符號 & 代替。A & B,表示只找出 A 跟 B 同時出現的資料。
也就是說,如果想要找音樂劇「貓」的資料,為了避免找出許多寵物貓的資訊,只要輸入「貓 & 音樂劇」就可以過濾掉許多不需要的資訊。
/=======\
聯集 or
\=======/
舉例來說,如果您只用「張惠妹」這個關鍵字來找的資訊,卻又不想錯過許多「阿妹」的資料,您可以使用「張惠妹 | 阿妹」來將有關的資訊一網打盡
或是想要一次把「皮卡丘」、「趴趴熊」查出來,也可以使用「皮卡丘or 趴趴熊」的指令來查詢。/=======\
差集 not
\=======/
NOT,不拘大小寫,也可以用半形符號 ! 代替,用以縮小查詢的範圍。A & ! B,表示要找出包含 A 關鍵字,但是排除 B 關鍵字的資料。
例如當您想找影視明星「天心」的資訊時,只用「天心」這個關鍵字查詢,會一併查到以天心為名稱的公司,如果使用「天心& ! 公司」查詢,就可以避免找到許多不符合預期的資料了。
人工編製的稱為主題名錄。
雅虎奇摩, http://tw.yahoo.com/; PChome Online, http://www.pchome.com.tw/
國家圖書館全球資訊網, http://www.ncl.edu.tw/tncl1.htm
國立中央圖書館台灣分館全球資訊網, www.ncltb.edu.tw/
圖書館 - 電子化政府入口網站, http://search.taiwan.gov.tw/info/DispSiteCat.jsp?cid=9688
大英圖書館的研究資源, http://www.bl.uk/collections/resres.html
臺灣學術網路資源概述, http://www.edu.tw/tanet/tan-intro/br4.html
資源有限慾望無窮, 以十個問題檢查是否浪費網路的資源:
有三個「YES」,算是輕度的網路資源耗損者,四到七個「YES」是中度的耗損者,八個以上的話,算是網路資源浪費者,各網路公司的最恨。
不過,浪費網路資源恐怕是發展過程裡,必須經過的階段,明知不合適,卻又阻止不了。
當您開始在網際漫遊,慢慢會寫電子郵件給朋友了,會上 BBS 和別人聊天後,請您開始注意,雖然網際社會 (cyberspace) 是個虛擬的環境,但是人與人之間起碼的尊重仍是有的。在您要上傳您的文章到某個電子佈告欄時,請先看看學術網路上的 BBS站管理使用公約。簡言之,請您一定要做到以下三點:
您在網路上活動時,行為是否良好呢?是否應該檢討一番?當然只要您上過台灣任何一個電子佈告欄,都可以看見佈告欄一開始就規定了一大堆,鉅細靡遺的程度有時令人歎為觀止。
(一)如何管理自己的電子郵件
(二)使用 TELNET
(三)使用 ANONYMOUS FTP
(四)電子通訊
(電子郵件,LISTSERV 討論群,Mailing List 以及 Usenet)
(五)電腦倫理十誡
引述Yahoo!奇摩隱私權中心的資料, http://privacy.yahoo.com/tw/privacy/
Yahoo!奇摩非常重視用戶的隱私權,因此制訂了隱私權保護政策。請你細讀以下有關隱私權保護政策的內容。 |
如果你的伺服器許可,每個網站都可以將其 cookie 傳送到你的瀏覽器,但為了保障你的隱私,你的伺服器只會准許網站取用本身傳送的 cookie 而並非由其他網站傳送的 cookie。
關於 cookie 的選擇
Yahoo!奇摩使用自己的 cookies 作為以下幾種用途: