Hypertext Mark-up Language(.html)檔案格式由 Tim Berners-Lee製定,在World Wide Web 草創時期流傳開來。後來由World Wide Web Consortium(W3C)接手,嚴格地制訂規格書。歷經2.0,3.2,4.0等格式,最後演變成與HTML 4.01 [6]相容,但以XML為基礎的XHTML1.0 [5]。此種規格相容於未來標準XML[9],且具有公開的DTD描 述其規格。而在目前支援HTML的軟體繁多, 不論是製作(authoring),閱覽(browsing),轉換(converting),都有許多選 擇。
.html搭配 Cascading Style Sheet,可以製作出許多不同的版面效果, 足以應付日常文件排版的基本需求。更重要的是這樣的安排鼓勵文件創作者朝 [內容與 外觀分開處理 (Separation of Content from Presentation)]的方向思考,在增加文件外觀一致性的同時,又有降低工作 量的效果。 此外,這樣的思考方向對於未來全面更改版面留下更大的彈性。過去.html所列印出來的畫面,較難對版面配置做細微的控制。現在CSS內已有針對不同 [Media]的 printingdirectives,未來瀏覽器對此支援應該會逐漸加強,終將不再成為問題。順便一提,Media的控制,還包含Aural(聽覺)輸 出的指令,對於無障礙文件之製作,有很大的幫助,將可加惠視障者。
文件內若含有圖檔,通常需要分開儲存。 這個問題其實並不嚴重,因為借由串檔壓縮技術, 可以在傳遞文件之前將之整合,順便壓縮。
為[OpenOffice.org]中 Writer的專用檔案儲存格式。1999年,Sun取得OO.o之前,OO.o已在德國發展十多年,2002 年,OO.o 1.0正式問世。
採用OO.o的主要理由是減少成本、開放格式、安全性等原由。 OO.o的格式是開放的, 不僅有[格式定義文件], 還有許多[轉換工具], 所以要讀 .sxw 檔, 不見得非裝OO.o不可。 例如 [soffice2html] 就是一支輕薄短小的 perl 轉換程式,可以將 .sxw 轉成 .html。[10]優點
- 沒有授權限制
- 製作/閱讀軟體價格低廉 (StarOffice) 或完全免費 (OO.o)
- 表達力豐富
- 製作/閱讀軟體類似目前使用率最高的 MS Office, 因此已經會使用 MS Office 的人可以很快的上手,不需再重新學習
- 可以輸出 .pdf 檔 OO.o Linux 1.0 版及 OO.o Windows643 版以後均可由其文書處理軟體 Writer 直接輸出 .pdf 檔, 能夠配合臺灣目前以 .pdf 為公開標準的政策方向
缺點
- 製作/閱覽 .sxw 的軟體並不多
Rich Text Format(.rtf)是定義文字和圖案格式的一種規格,是由Microsoft所制定及公佈的,目前最新的版本是1.6。在RTF的規格中是使用 American National Standards Institute (ANSI), PC-8, Macintosh, or IBM PC 等的字元集來控制文件在螢幕和印表機中的呈現和格式。一個符合RTF規格的檔案由純文字、控制字串、控制符號和格式群組所組成。控制字串是指將文字格式化 的命令,其最長不超過32字元。而格式群組包含純文字、控制字串、控制符號,在RTF規格的定義中,格式群組是以大括號"{}"來標示,而每個格式群組 中,所描述的文字屬性將會影響被描述在格式群組中的文字。[11]
優點
- 其主要的優勢在於 .rtf 的格式在大部份的文字處理器都可以被支援。
缺點
- .rtf 在文件的格式上是以描述版面為主,故其文件所記載之內容被其他應用程式再利用的可能性並不高。
- 由於其格式控制語法是固定的,所以當每次格式的定義被變更後(新增、刪除、修改格式定義),必須修改相關之應用程式
- 對於系統整合性來說, .rtf並無法符合一般的需求。
- 此外,.rtf是一種可以支援任何文書處理器的檔案形式,然而RTF附加檔名可以避過目前市面上的防毒軟體掃瞄範圍。若目前使用的防毒 軟體沒有支援.rtf檔案的掃瞄功能,將無法偵測到梅莉 莎病毒,並達到防護的效果。 [21]
.pdf是由[Adobe]公司發展出來的檔案格式[12], 規格書公開, 但有 專利限制 並且其公開性建立在 廠商的善意 之上。 目前已有一些國際標準建立在 PDF 規格之上, 例如 [ISO-19005] pdf/a 與 [pdf/is]; 也有一些可以產生/閱讀 .pdf 格式的自由軟體, 例如 [KOffice]/ [OO.o]/ [AbiWord] [bg5pdf]。 等等。 但是其中的專利授權問題尚待進一步釐清。 另外在不同作業系統或不同的語言環境之間傳遞 .pdf 檔, 偶爾會有找不到適用字形的問題。
Adobe公司發展出PostScript程式語言[13][14],而所謂的 [PostScript 文件]即是以PostScript寫成的程式檔案文件,文件的第一行的開頭一定是「%!PS-Adobe」。文件的內容是描述著在平面哪個位置, 以哪個方式畫出什麼樣式的線條。雖然可以在編輯器中以寫程式的方式撰寫一份PostScript文件,但通常使用者都是藉由應用程式來編排文字及繪製圖 形,然後由應用程式輸出成PostScript文件 [15]。就如上描 述, 能產生PostScript檔的軟體太多了,像 [MS Word]、 [Adobe Illustrator]以及 [Adobe Universal PostScript Windows Driver]就都可以用來輸出PostScript 文件。
另外,科學界常用 TeX 或 LaTeX 等工具來排版科學文獻,排版之後再輸出檔案,此檔即為 .dvi (device indepentdent) 格式。一般而言,使用者都會將 .dvi 格式的檔案轉換成 PostScript 文件。
.doc是由Microsoft所發展出來的一種文件格式,亦是 [Microsoft Office Word]所專用的文件格式。由於Microsoft並未公開.doc的文件格式,故對於.doc我們所能知的並不多,而因其封閉性,也使得. doc產 生了一些問題。而其中對我們影響最大的就是個人隱私權的問題 [16],你 所 製作 .doc 檔當中, 含有你的電腦的網卡編號 (就像網卡的身份證或指紋一樣, 全世界每張網卡有獨一無二的 MAC 編號), 而Microsoft會在Windows註冊時,將使用者的資料傳送到Microsoft的網站。如果有必要, 可以由此查出這份文件是在那一部電腦上製作的 [17]。 更因為作者姓名公司電郵等身份資訊, 甚至是曾經用 undo 功能刪除掉的舊文字也會出現在 .doc 文件當中, 警局, 公司, 甚至國家都曾因為 .doc 檔洩密而吃過虧 [18]。 雖然微軟如此做的目的或許可能只是在追蹤非法的使用者, 但是對合法使用者而言仍舊有隱私受侵犯的疑慮。 在 [19][20]中 則說明了一些技術細 節。對於.doc檔的製作,若要完全符合軟體所定的規格就只能用MS Office Word,雖然,OO.o亦可以製作.doc檔,但卻無法完全支援 軟體最新定的.doc規格。
優點
- 製作出的版面精美
- 普及率高
缺點
- 空間的佔用
首先, .doc 檔會佔用很大的空間。 以這篇文章為例, 如果存成 .doc 檔大約是本來 (.html 檔) 的 5 倍。
- 巨集病毒的侵襲
其次, .doc 檔會攜帶病毒。 Word 的巨集功能很強, 但也因此讓有心人很容易在 .doc 檔中摻入破壞的指令, 導致收到 .doc 檔的人 "腦毀碟亡"。
- 相容性低
不同版本之間的 .doc 檔相容性很低,新版的 .doc 檔在舊版的Word中無法讀取。舊版的程式自然無法處理新版中增加的功能;但是至少應該把新版的.doc檔案中舊的功能顯示出來。
- 檔案格式的封閉性
公開的檔案格式規格書 (file format specification) 是確保資訊內容可以自由交換/轉換/流傳/保存的基礎。 探究上述問題有一大半原因來自 .doc 檔案格式的封閉性。 儲存文件如果採用的是沒有公開規格書的格式, 就像將自己的財產放入保險箱中, 卻由他人代管密碼一樣, 任何一次存取, 都要仰賴保管者的善意與配合。