Peer-to-Peer Computing,這種被Intel喻為第三代網路革命的「點對點分散式網路架構」,近來由於「Napster」與美國唱片藝術家聯合工會﹝RAIAA﹞的音樂版權官司而聲名大噪,但卻也因為該技術大量應用於音樂下載,而與MP3結下了不解之緣,揹負了侵權技術的原罪。
這種在兩台以上的電腦之間,彼此直接分享對方電腦資源的網路傳輸型態,有別於過去個人電腦﹝Client﹞,一定要連結上某個網站或公司的伺服器﹝Server﹞才可以下載取得檔案資料的主從式﹝Client/Server﹞架構作業模式,而直接可以從網際網路上數以億計的電腦中,精確的找到、取得指定的檔案,使PC的角色從Client更躍升為Server。這個變革就像是外匯存底開始藏富於民,不再統存於中央銀行。
辦公室裡Intranet「網路芳鄰」的資源分享,用的也是這種概念,不過卻在1999年,由美國的大學生Shawn Fanning開發出Napster程式,將之發揚光大。而其實被應用於MP3下載,無端捲入版權紛爭成為唱片業的頭號大敵,對這項技術而言不僅委屈,也小覷了它的威力。
目前P2P技術另一項赫赫有名的應用,就是一九九六年,由Arik Vardi這位以色列人所撰寫的ICQ程式。當使用者上線後,連上ICQ的目錄伺服器,會藉由列在電腦上友人的ICQ NO. 檢查對方是否也在線上,並相互傳送彼此的 IP 位址。一但雙方都連上伺服器,也互有對方的 IP 位址後,就可以點對點,不經過 ICQ 的伺服器,直接傳送訊息給對方,較之E-Mail的好處是可以確知誰正在線上,並讓訊息「即時」交談,而不必一直按「傳送/接收」,透過ISP 的Mail Server來收取訊息。
簡言之,「去中間化」、免除仲介的「電腦聊天」﹝Computer Chat﹞方式是P2P技術最為特殊的革命性觀念。未來更可能顛覆現有的搜尋引擎模式,找尋資訊不必再因粗略的「關鍵字」而流連於各個不知名的網站間亂碰運氣,下載資料也不用怕該網站的伺服器因流量過大而傳輸緩慢,全球願意分享檔案的PC,只要在線上透過P2P,都成為你可以任意取用的資料庫。網路上的任何實體PC皆能發現彼此的存在,不僅資料選取精確,還可以任選頻寬最適合自己連線速度的電腦下載。
除了自由交換檔案、即時傳遞訊息,P2P技術還可以多重並聯、集結眾多分散在網路上的電腦,貢獻各自一部份的運算能力,共同結合成具有強大計算力的超級電腦。
最著名的兩個例子,一個是1999年開始的SETI@home﹝Search for Extraterrestrial Intelligence at Home;在家裡尋找地球以外的智慧文明﹞計劃。分佈世界各地自願者的電腦只要裝上SETI程式,透過P2P連線加入運算,就能協助分析來自波多黎各的Arecibo無線電望遠鏡所蒐集;來自太空的龐大無線電波數據,從而探測外星人是否存在。
另一個則是名為「Philanthropic Peer-to-Peer」的慈善計劃。由美國癌症研究基金與英國牛津大學合作;Intel公司贊助的醫學研究計劃,初步先以白血病的醫治方法做為首次的研究目標,平常利用全球志願參與者電腦的閒置時間處理資料,當其上網後再將處理結果傳送回研究機構的電腦中。聚沙成塔,有效利用剩餘的運算資源並能爭取時效,像是另一個網路版的四海一家「We Are The World」。
從上述的幾個應用方向可以看出;P2P的核心價值,是分享,也是共構。不僅能直接分享彼此電腦中的資源,也能聚眾力而成大志。在此,似乎隱約看到了網路大同境界的雛型。
互助與共享的網路理想,顯然科技已做好準備,但人性呢?一個諷刺的事實是,據調查在四千萬Napster的用戶中,只有0.02%的人真的提供MP3與人分享,絕大部分人卻只是拿而不給,人性的自私始終是大同世界的最大障礙。路還很遠,也許永遠都走不到。
然而更便利、更自由、更輕鬆和更大量的資訊交換技術,卻也不免出現副作用及新衝擊。首先是智慧財產權的保護將愈來愈困難,其次是內容收費的營利可能性將受到嚴厲考驗。及早因應趨勢、找出平衡點,恐怕是網路在邁向大同之路前,業者及各方要優先思考的課題。
本文出自90/07/04第78期《DigitalObserver數位觀察者》
kevin@digitalobserver.com
===================
P2P的技術架構 / Jones Lin
http://www.digitalobserver.com/111-120/115/reader.htm
http://www.digitalobserver.com/111-120/116/reader.htm
今年2月,知名O'Reilly 出版商在美國舊金山Westin St. Francis 旅 館舉辦為期四天的全球性P2P(Peer-to-Peer)第一次產業會議,雖值 網路業寒冬,但從參與的創投業者及科技業者之盛況,概略說明 P2P在資訊產業的未來地位。筆者適逢此會,穿梭於各討論議題 中,深感P2P的潛力。
此次會議主體為技術併投資性質,提供各國與會者進行專業資訊交 換,探討P2P目前的生態及未來的方向,同時提供創投業者進行多 元評估,尋求產業機會。然而,令人意外的,此次會議並沒有針對 造成唱片業者震撼,目前仍在引領風騷的MP3音樂檔案下載軟體 Napster,進行稍具規模的討論,僅被極輕度地提及。會議之主軸擺 在依序Gnutella、FreeNet、P2P在企業的應用、以及其他元件技術 如安全及檔案封裝格式等等。
筆者認為捨Napster議題不談的原因只有一個,那就是Napster已佔 據了檔案分享(File Sharing)的這塊市場,在一個集創投與頂尖資訊 業者的產業會議裡,談論此議題已不具太大意義。在全球擁有六千 萬註冊會員,隨時有超過數百萬人連線進行檔案交換的強大優勢 下,Napster已經驗證了「先佔先贏,大者恆大」的特性。後繼競爭 者欲進入這塊以英語系為主的市場,具體地面臨到極高度的門檻, 除非從文化差異做區隔。國內類似的經營模式ezPeer,就是著重華 語市場,掌握文化的差異成為其優勢。兩者使用的技術類似,詳細 點將於後續文中介紹。
P2P是一種標籤
P2P是一種標籤而不是一個定義,它強調的是網際網路架構之下端 點對端點(Peer-to-Peer)、程式對程式(Program-to-Program) 、電腦 對電腦(PC-to-PC),人與人間(People-to-People)四重直接的關 係。peer具同儕之意思,它可以是個軟體程式,同時擁有網路上客 戶端(client)和伺服端(server)的雙重能力,兩個peers之間的溝通是 兩組客戶端對伺服端、伺服端對客戶端的連線關係。電腦對電腦的 關係是指兩端硬體資源透明(transparent)分享,這些資源包括硬碟 儲存、計算處理、以及上網能力。而人與人間的關係是指藉傳訊來 進行溝通,層次可以是從聊天訊息至心靈交流。
P2P是如此地C2C(消費者對消費者),它具備幾項特性來支援網路商 業C2C應用。
簡單性(Simplicity)─它簡化了網路連線的過程,直接應用網址(IP)連 線,使用者不再需要記住連線對方的網域名稱(Domain Name),移 走了看似簡單但對泛泛大眾而言卻是煩瑣的網路設定。
透明性(Transparency) ─連線對方的所在是透明的,每一個使用者 可以與其他使用者進行直接連線,互相知道對方在做什麼,不同於 登入一個網站的使用者間是互不認識的,不知道對方在做什麼。
立即性(Immediacy) ─因為採直接連線,使用者間可以進行立即溝 通,增加時效性。
P2P核心技術(尤其指Napster類者)是立即傳訊(Instant Messaging),這種機制採用國際RFC1459之IRC(Internet Relay Chat Protocol)協定的部份標準。此技術已存在多年,傳訊可以是及 時的,也可以是非同步的(Asynchronous)。IRC本身是一個會議傳 訊系統,它是應用在分散式伺服主機連線之上,伺服器扮演接受客 戶端連線以及轉接訊息至其他伺服主機上的雙重角色,而一個客戶 端僅連線至一個伺服器,每一個客戶端是藉其暱稱及其所連線的伺 服器名稱來辨認。
再者,搜尋引擎(Search Engine)以及檔案傳輸(File Transfer, FT) 是 P2P檔案分享的核心技術,結合立即傳訊技術,形成了圖一所示的 基礎結構。
圖一 P2P技術的基礎結構
混合式P2P-Napster/ezPeer
如圖二,Napster以及ezPeer之基本運作分為五個層次:由左至右, 分別是廣大的使用者、使用者所提供的資訊內容、中介的網路連線 服務、資料庫索引管理與查詢之電腦伺服群組、以及個人或團體所 提供的內容服務。
圖二 混合式P2P技術的基本運作
使用者個人電腦透過中介的網路連線服務,連接到伺服電腦群組其 中的一台之後,將分享檔案之索引「上架」至伺服電腦裡以建立資 料庫,供其他所有使用者索引查詢。資料庫扮演媒介的角色,告知 使用者A何處有他想要的檔案,當使用者A確定要從使用者B取得 時,AB兩點即刻建立連線,進行檔案內容之傳輸交易。
伺服媒介平台是由多個電腦群組所構成,每一個群組是由4~5台電腦 伺服器藉由網內網路相互串接而成,某種程度而言,具有容錯 (Fault Tolerant)的能力。群組與群組間並沒有採直接線上溝通,然 而藉著中央負載平衡控管,使用者可橫跨各群組而毫無痕跡。
每一個使用者本身(某種程度而言)是數位資訊內容提供者,當使用 者眾,資料庫所累積到的分享檔案數呈倍數成長。除此之外,專業 的內容提供者也可將資訊上架給位於中間的電腦伺服群組,提供 B2C服務。總體而言,資訊內容的累積提供給個人的是一個知識管 理平台。
此架構是一種分散式(distributed)運算及集中式(centralized)管理之 混合體,它是夠分散地,因為檔案內容傳輸發生在使用者端點之 間,並未牽涉到伺服端,允許各端點之自主性(Selfishness)。當眾 多傳輸同時發生時,運算負載與資料流量是平均分散各端點的。此 架構也是夠集中地,因為中心伺服群組管理並組織所有使用者的檔 案搜尋索引(Index)以及網路位址(IP Address)兩種資料庫,前者提 供檔案快速指認的功能,而後者提供使用者間相互認知 (Recognition)的機制,使用者藉交易對象的暱稱(ID)而對應至其網
路位址。
分散式P2P-GnutellaNet
GnutellaNet之運作是一種類似電話連線網路,呈現一種多重樹形,各節 點提供轉接的服務。當登入網路後,首先它盡可能告訴你,網路現在有 多少你的平行同儕(horizontal peers),也就是對你的歡迎。不過,你僅認 識鄰近同儕,他們其中的一位再認識其同儕,依此類推而擴展至整個網 路。
在此架構下,當使用者欲詢問某一個檔案時,他透過所有鄰近之同儕將 此詢問傳話下去。當中任何一個同儕聽到此傳話時,就會繼續傳話下去 給其他同儕,如此繼續下去。任何擁有此檔案的使用者會反方向地傳話 回去,說明我有這個檔案,在回傳的過程中,沒有同儕知道誰是原始的 詢問者,只是繼續傳話下去,即使回傳至詢問者的鄰居,他也不知道下 一批傳話的對象當中有一位就是詢問者。
雖然Gnutella利用幾個伺服器來暫存同儕的連線資訊,方便新使用者加 入,但運作時並沒有集中管理,是完全分散式地,任何一個節點(同儕)擁 有完全相等的能力。然而某個位於流量繁忙通道上的節點,可能會因過 多的傳話而造成堵塞。
混合式vs分散式
以Napster為代表的混合式P2P和以Gnutella為代表的分散式P2P各具特性, 前者常被質疑的一點是因其具單點脆弱性(point of control) ,因為它採集 中式管理,是一個易受政治干擾的點,沒有了它,其他整個分散的使用 者將因無協調機制而停頓。而後者分散式P2P雖然無此問題,但卻遭受到 下的質疑:
1. 虛擲(overhead)流量可能拖垮網路,因為資訊利用耳語相傳的方式散 播,在一次詢問過程中,實質有效連線可能只佔總詢問量極少數的比 率,造成虛擲過高。據此,當混合式P2P已經達到數百萬至千萬連線數 時,分散式P2P如何將連線數從數千增加至一萬呢?
2. 如何建立消費者與企業的關係?分散式P2P不具集中式管理,無法進行 訊息推播(information push),企業將無切入點來進行B2C行銷交易等。
3. 如何做群組(grouping)?FreeNet的代表曾經回答說『因為人們是地域性 地分散,FreeNet有興趣的是連結人們而不是組織他們』,這種迴避性的 回答,說明了分散式P2P執行群組的難度。因為使用者間不容易自我組 織,特定意識之「群組」難形成。
混合式P2P是一個絕佳的媒體通路,容易形成「社 群」(Community)、「群組」(Grouping)、以及「個人 化」(Personalization)三層架構。使用者匯集在同一個通路,自然而然形 成社群,如ezPeer形成多媒體社群。再者,社群經營具易於管理,口耳相 傳的特性,很容易在社群裡進一步地形成「次文化」群組。譬如衍生爵 士樂、旅遊以及賞鳥之各次文化。除了這種依性向而形成的群組之外, 其他依互動式投票以及民意調查等,也可組織各自群組。最後,P2P可深 植個人化經營,使用者已因Peer的技術而有當家做主的自我價值,再輔以 集中管理所提供的統計服務,個人的特質就被突顯出來。
P2P改變網路內容供需機制
90年代瀏覽器(Browser)的興起,網站(Web)的商業模式不斷地掘起,而 個人電腦(PC)在網路上一直扮演著客戶端(client)的角色。隨著計算處理以 及儲存速度不斷的提升,加上全天候寬頻連接已經成為基本配備,一部 個人電腦已經可以像小型企業裡的伺服電腦一樣的被使用了。
然而,這種進步並沒有機會被適用,漸漸人們開始懷疑花錢購買一部功 能強大的電腦回來,僅僅作為收發電子郵件或者當做一部網路瀏覽器的 活系統,是否小題大作。於是乎,幾年前某些XC電腦的概念才被提出來 呼應此種「價錢」與「符用」兩者不協調的情形。
造成此種不符用的情形,主要的原因之一是由於網路內容供需機制長期 以來是一種少數供給多數需求的星狀(star)或者衛星(satellite)之結構,少 數網站主導任何內容之提供、授權、加值等之各項媒體權利,大眾必需 透過互相連結瀏覽才能取得內容。之後入口網站(portals)的出現,將資訊 的流量控制在單一窗口的搜尋,仍然沒有改善這種瀏覽器與網站間單向 主從的關係。這種關係限制了網路內容成長(scaling)的能力,也限制了原 創者自由發表的管道,人們發現不能夠主宰(hosting)任何事,供需機制並 沒有被突破,於是網站內容漸漸僵化、寒冬化。
P2P技術改變這種網路內容的供需機制,媒體的權利從少數網站重新賦予 給個人以及P2P所形成的交叉網(mesh)結構,創作性以及時效性大幅增 加。以音樂創作為例,過去受到少數團體的限制,從製作、包裝、行 銷、通路以至最後等待消費者來接觸,往往需時數月,時程是非常冗長 而不是很經濟的。如今透過P2P音樂社群,作品從製作完成之後就可上架 行銷,直接接觸音樂消費者,行銷的對象就是使用者,大大縮短時間成 本。相對之下,Intel 技術長 Pat Gelsinger 曾經指出P2P是繼 Mosaic 瀏覽 器發明後第三波"網路革命"。
P2P待克服的議題
P2P待克服的議題包括管理(management)、安全(security)、互信(trust)、以 及臨場(presence),其中的一些議題並不是顯而易見的容易:
1. P2P對企業而言將創造不少的優勢,譬如降低硬體投資與協力工作等。 然而,分散式軟體需要安裝、設定、更新以及缺乏監控系統(monitoring system),都將成為IT人員反抗P2P的阻力。因此,技術已在那裡,如何平 衡優勢與阻力將成為P2P須克服的議題之一。
2. P2P解放了個人電腦,將之推向網際網路的邊緣,然而卻開了一個安全 的隱憂。重要的是並不是P2P程式不安全,而是它暴露了個人電腦的所 在,此種隱憂可以藉防火牆來減輕。
3. 使用者互信是P2P平台的關鍵,機制難度高。短期只能認定P2P是高層 次互信,使用者必須相信對方。一種暫時性的解法,可以提供類似eBay 的信用評鑑系統,讓使用者主動回饋並互相評鑑。
4. 臨場包含兩個層次,個人電腦是否可以被連接以及使用者是否待機, 一個離開電腦旁邊的使用者與不進行P2P互動的使用者,是無法被區別 的。
因此從發展趨勢來看,未來幾種產業將從P2P模式受益,如公信產業、元 件廠商如檔案封裝加密、甚至於數位智權管理(Digital Right Management) 等。然而,從高唱在網際網路上自由開放,消費者至上的角度來看。為 了維護智權,或建立任何妨礙使用者習慣的機制,是否會造成抗拒而嚇 跑消費者,重蹈網路泡沫的覆轍,值得進一步評估。
結語與預測
P2P最可貴之處在於網路資源整合與累積:未來數以億計的CPU以及數以 百億計的硬碟位元將被整合於網際網路上,使用者共享了整個資源,而 不是過去使用者與網站之間單向資源而已。個人電腦因此被升級,它不 再是躲在網路背後的一具瀏覽器,它將是網路世界上的一個附加價值, 也是網路世界邊際的一個設備(Device)。同時,P2P繞過網域名稱伺服 (Domain Name Server, DNS)的機制,創造一個遠離DNS的世界。最 後,P2P挑戰了單向Web的存在,逼使了Web業者思考雙向網頁(Two- Way Web)。
五位與會舊金山P2P會議的專家,包括一位資訊媒體業者以及四位資訊廠 商執行長,對未來五年的資訊產業進行預測投票。這位媒體業者和其中 一位執行長投給P2P,另外一位將票投給電子郵件系統,一位投給分散式 運算系統(P2P是分散式運算的一種延伸),最後一位預測集中式(指Web)與 分散式擁有各半的機會。
就同樣以廣大消費者為對象的Web與P2P而言,筆者也在此作一個預測。 商業經濟面上,Web的階段任務已完成,接下來網際網路的舞台是提供 給P2P以及分散式運算來發揮。技術層面上,Web還會繼續存在,只是它 將扮演技術整合的一個支援角色。(全文完)
(作者Jones Lin為目前台灣發展P2P模式相當成功的ezpeer 現任技術長,ezpeer網址:
http://www.ezpeer.com.tw 作者email: jones@siriuz.com)