- 前言
- 封閉格式
- 開放格式
- 開放標準的原則
- 開放電子檔案格式的特性
- 判斷基準
- 電子出版品格式
- 政府認可的電子檔案格式
- 案例
- 美國紐約州
- 美國奧克拉荷馬州
- 南非
- 秘魯
- 結論
電子檔案的格式甚多, 依其資料的內容, 可以區分為文字檔、影像檔、壓縮檔等; 依其使用的目的, 可分為開放式及封閉式兩種。本文探討開放式電子檔案格式的類型, 及其在政府單位的應用。
Electronic file format veries. Based on its content, may differentiate as the text files, the image files, the compression files and so on. According to its usage, may divide into open format and the enclosed two kinds. This article discusses the open file format and its application within government.
軟體及程式設計師以電子檔案的延伸檔名, 做為標示檔案類型之用。基於商業或其他理由, 幾乎每個軟體都有其特定的檔案格式 (註1), 願意公開其規格書的電子檔案格式,祗是其中的少數, 採取開放態度讓其他團體自由使用其電子檔案格式, 更是少數中的少數。
檔案格式的規格, 係供製作閱讀及製作該等格式的檔案之用, 其內容有二: 先規範該檔案為二進位檔或純文字檔, 並指示儲存資料的方法。
檔案的分類有很多方法, 不以下列的分類為限(註2):
2001年7月27日,美國南加州大學(University of Southern California)神經生物學家約瑟夫•米勒(Joseph Miller)因研究需要,向美國航太總署申請檢視維京探險計畫(Viking Probe)於1970年代中期取得的火星資料;赫然發現,已有25年歷史的該等電腦檔案,已經無法讀取,當初撰寫該檔案格式的軟體工程師,已經往生或無 法再回頭檢視當年的工作,旁人也無法解讀當年的程式原始碼(註3)。
以授權條款封閉的電子檔案格式,有相當的市場佔有率,以此格式製作的檔案,需要特定的軟體及硬體才能夠讀取其內容,它的缺點已經被指出(註4):
流行未必等於標準。以MS Word 所產生的 .doc 檔, 有廣大的使用族群, 但它的軟體授權聲明上卻清楚寫著客戶不得對它進行逆向工程。讀寫相容的檔案格式都需要獲得特定公司的授權, 這樣的檔案格式如果成為業界甚或國家的標準, 豈不是以公權力圖利特定廠商?
免費未必就是公開。2000年初, Digital Convergence推出的提示貓(:CueCat) 條碼閱讀器, 不僅軟體免費, 連硬體都是免費的, 甚受使用者歡迎。但是當它的資訊接駁管道 被破解, 而公佈在網頁上時, 隨即威脅要控告程式設計師。免費而封閉的軟硬體, 就像包了糖衣的毒品, 先吸引消費者上癮, 再加以宰割。(註7)
沒有一條清晰的界線, 區分電子檔案格式屬於開放或封閉, 也沒有確切的定義, 規範開放或封閉的內容, 公開檔案格式的規格書應是第一步,
法律上的授權及商業上的應用是不可忽視的領域。
開放的電子檔案格式, 必須是開放的標準, 業界標準、國家標準或國際標準均可。符合該等標準的電子檔案格式, 有若干共同的特性。因此,
可以歸納出若干基準, 據以判斷特定的電子檔案格式是否屬於開放範疇。
開放標準的原則有六:可及性、使用者的選擇權、 免授 權費、無歧視、擴展或縮限、掠奪市場(註8及註9)。
可以被任何人閱讀及應用;因此:
開放標準的目標是建立公平、有競爭力的市場,不可針對特定的使用者。因此,開放標準應:
任何人都可免費使用開放標準,沒有授權費,標準組織得向申請認證的使用者收取認證費用。因此:
祗從技術觀點審視開放標準,不可偏袒任何應用者;認證單位必須提供可行的低價或免費的基本認證。因此:標準組織的認證應有額外認證及平價認證兩種管 道。額外認證由標準組織強化廠商的產品,平價認證由廠商自我認證。
廠商可以擴展或縮限使用開放標準,認證單位依照使用的開放傾向,得拒絕或接受該等擴展或縮限。
在保護開放標準本質的前提下,不得限制開放標準的擴展,祗要求廠商以授權方式,出版擴展開放標準的資訊,與該等擴展有關的軟體製作、散布及銷售。昇 陽公司的產業標準原始碼授權(Sun Industry Standards Source License),要求擴展標準的內容,必須公開出版,在不介入個別發明的前提下,保障彼此的互通性。
即便採用公平合理的授權(Reasonable And Non-discriminatory)方式,還是不能保障使用者的權利,因為, 使用者沒有能力逐一查證或瞭解授權的實情,往往在事後才被廠商指出侵權的所在(註10)。
因此, 在開放標準架構下制定的電子檔案格式,必須具備下列特性(註11),才堪稱開放電子檔案格式:根據前述的開放標準的原則及開放電子檔案格式的特性, 可以歸納六個基準,
屆以判斷電子檔案格式的開放性:規格書、法律授權、上下相容、軟體豐富、轉換多元、搜尋便利(註12)。
將檔案格式的規格書(file format
specification)公開, 是確保資訊內容可以自由交換/轉換/流傳/保存的基礎。
規格書本身必須以平實的文字詳盡撰寫, 專業人員可據此撰寫程式, 讀取該等格式的檔案,
並製作可被其他程式讀取的檔案。該等文件的闡釋及範例的授權, 必須符合開放源碼促進會認可的授權方式。
以公開規格書的電子檔案格式製作文件,製作者或閱讀者隨時可以運用該 等檔 案,不需要檔案規格書制定者的善意與配合。(註13)
依據規格書的公開程度, 將檔案格式分為以下等級:允許任何公司或個人撰寫製作及讀取該等檔案的軟體。即使規格書可以取得, 若有特殊法律障礙阻止程式設計師撰寫相容程式, 大量採用這等檔案格式, 還是對社會造成相當的風險。
依據不同的法律障礙程度, 將檔案格式分為以下等級:
最新的影像手機可以與古老的電話機互相通話(當然影像無法顯示); 最新的 DVD
播放器可以將視訊傳送到古老的電視機, 這些都是上下相容的例子。理想的檔案格式, 不只要讓新軟體可以讀舊格式,
還應該讓舊軟體能夠讀新格式裡的舊規格資訊, 如靜態圖/文等, 不可完全拒絕開啟新文件。
以簡單方式進行批次搜尋, 在多個檔案裡面搜尋特定字串是搜尋的考慮要點。
在近用方面,也有一些規定:
2001年12月,由行政院研究發展考核委員會檔案管理局訂頒之機關檔案管理資訊化作業要點,在附表五 - 電子檔案格式表,訂出文字檔、圖片檔、聲音檔、視訊檔、工程圖檔、文字影像檔等六類檔案格式(註18)。
文字檔的XML、圖片檔的JPEG、聲音檔的MP3及MAV、視訊檔的MPEG-2、工程圖檔的IGES, DXF, STEP、文字影像檔的JPEG及TIFF等格式,被認定屬於開放性標準的範圍,即屬於廣義的開放檔案格式。
類型
格式
說明
文字檔
XML
一、開放性標準。
二、電子公文傳遞交換格式。一、業界認定可攜性文件格式,軟體功能齊全。
二、文書及檔案案管理作業規範所定文字檔格式。圖片檔
JPEG
如檔案係以影像掃描製作,一律採全彩,壓縮品質為75%以上 ,解析度300 DPI以上。二、開放性標準。
聲音檔
MP3 開放性標準。
WAV
一、開放性標準。
二、文書及檔案案管理作業規範所定聲音檔格式。視訊檔
MPEG-2
一、開放性標準。
二、文書及檔案案管理作業規範所定動態影像格AVI
專屬軟體。
工程圖檔
IGES
美國國家標準(ANSI Y14.26M)。
DXF
開放性標準。
STEP
國際標準(ISO/IEC10303)。
文字影像檔
JPEG
一、彩色影像:採全彩,壓縮品質為75%以 上,解析度200 DPI以上。
二、開放性標準。TIFF
灰階影像:採解析度200 DPI以上。
TIFF
一、黑白影像:採CCITT G4標準,解析度300 DPI以上。
二、業界認定開放性標準。原註:本表所定規格,指保存為主之電子檔案,如係為開放應用,得考量儲存空間、傳輸效率等因素,予以壓縮 或其他適當方式處理,但以目視清晰為原則。
公文文書電子檔包括公文本文檔及附件檔,公文本文檔的格式及組成欄位參見文書處理手冊,公文附件類型分為:文字檔、靜態圖形檔、工程圖檔、動畫檔、
聲音檔、動態影像檔、紙本文件及無法電子化之實物等。已電子化之附件按參之二、附件採用格式傳送。
行政院研究發展考核委員會以12項準則,評估公文電子交換之共同傳輸檔案格式:
最後決定採用可擴充之標示語言(eXtensible Markup Language, XML),並據以制定公文電子交換和處理之技術規範。
各國對電子檔案格式的態度不一,甚少理解到此議題對國家安全、知識傳遞的影響,美國若干單位已經提出具體方式,秘魯及南非已經透過立法的程序,要求
政府採用自由軟體製作公文書,保障當代及後代子孫的資訊權不致因為電子檔案的格式而受影響。
美國的Oregon、Texas、Oklahoma、California、New York
City等州級政府,南美洲的秘魯、南非等國家已經完成立法程序,要求官文書及公眾資訊必須以開放檔案格式儲存,以保障人民的資訊權(註19)。
2003年4月29日,美國紐約州議會就該州採用自由軟體事宜辦理公聽會,邀請專家做證,提出七項意見,主張採用自由軟體(註20):
州政府機關及採購中心於簽署任何買賣電腦軟體的合約,必須要求廠商提供該軟體的原始碼。
雖然沒有指明需採用開放的電子檔案格式,實質上可以根據提供的原始碼,解讀出該等軟體使用的電子檔案格式。
2002年3月21日,秘魯微軟公司總經理致函推動該等法案的國會議員(註24),一方面重申該法案對軟體的安全及保固沒有保障,又指出可能侵害第
三者的智慧
財產權;並且暗示微軟的產品仍有降價空間。
秘魯國會議員以一封更長的回函反駁微軟的論點(註25),並指出微軟公司的開放源碼政策,祇是文字遊戲,並不符合於自由軟體或開放源碼促進會的精
神。
同年5月27日,在秘魯的美國商會總經理致函秘魯國會議長(註26),警告轉換自由軟體的代價甚高,軟體成本祗佔總費用的少部份,政府已從使用商業
軟體取得相
當好處,以及自由軟體沒有足夠的後續服務。
2002年6月間,美國駐秘魯大使分別致函給秘魯國會議長等人(註27),先是談到秘魯軟體業者的15,000個工作機會,又提到外國的投資意願。
同年7月15日,微軟公司捐贈價值55萬美元的軟體及服務給秘魯政府(註28),做為推動電子化政府之用。
這些政商結合的遊說行為,使相關法案難產,已通過的法案也難以具體執行。
在行政院研究發展考核委員會的規畫下,現有的法令已經朝向開放檔案格式的方向前進,政府機關有足夠的依據拒絕使用專制的檔案格式,電子出版品及檔案
採用開放格式的技術已經起步。
公眾資訊不以政府機關出版品及檔案為限,意圖供社會大眾使用的任何出版品及檔案,都屬於公眾資訊的範圍,減少近用公眾資訊的障礙是製作及出版公眾資
訊者的責任。
數位落差的成因及解決途徑,有兩種思考角度:人口統計學及資訊近用。
以人口結構區分,加強偏遠地區、弱勢團體、婦女團體等單位的基礎建設,是各國用來縮短數位落差的手段,具有短期的效果。從資訊近用的角度努力,改善
公眾資訊的普及性,消除公眾資訊的技術障礙,是縮短數位落差的根本之道。
所有的網頁在2004年7月30日檢視時, 均屬正常, 並已下載備份。
1. 很多網站蒐集整理檔案的延伸檔名, 協助使用者辨識檔案的性質, 參見:
2. My File Formats - The Programmer's File Format Collection, http://myfileformats.com/index.php
3. Report by the Director-General on a Draft Chapter on the Preservation of the Digital Heritage [保存數位遺產報告], by Unesco, 164 EX/21 9 April 2002, http://unesdoc.unesco.org/images/0012/001255/125523e.pdf
4. Goldberg, Jeff, MS-Word is Not a document exchange format [MS-Word不是文件交換格式] . http://www.goldmark.org/netrants/no-word/attach.html7. DigitalConvergence, http://www.cuecat.com/
8. Open Standards: Principles and Practice, http://perens.com/OpenStandards/Definition.html
9. Krechmer, Ken(1998), The Principles of Open Standards / by , Standards
Engineering, Vol. 50, No. 6, November/December 1998, p. 1-6, http://www.csrstds.com/openstds.html
10. The Programmer's File Format Collection, http://www.wotsit.org/
11. Patents and Open Standards, http://xml.coverpages.org/patents.html
12. 洪朝貴, 政府機關資料文件交換之電子檔案格式應用研究, 行政院研究發展考核委員會委辦研究計畫 09240D003459, 民國93年3月10日, 頁7-10
13. Open File Format Definition, 在Texas Open Source Initiative
Mailing
List討論結果, http://www.anansispaceworks.com/Documentation/BuildImage/Legal/tosi.openformatdef.2003.03.19.html
14. Sample Open Data Format Bill: Open Data Format Initiative:
Version 2, August 05, 2003, http://odfi.org/archives/000025.html
15. Krechmer, Ken(2002), Cathedrals, Libraries
and Bazaars,
In Proceedings of the 17th Symposium on Proceedings of the 2002 ACM
Symposium on Applied Computing, ACM Press, 2002, p. 1053-1057
16. 政府出版品電子檔繳交作業規定, 中華民國九十一年五月七日行政院研究發展考核委員會會版字第0910010025號函發布
17. 政府出版品管理法, 中華民國八十七年十一月四日行政院台八七研版字第○四五五一號令發布, 中華民國九十年十二月十日行政院台九○研版字第○○二六七一五之一號令修訂, http://gpnet.nat.gov.tw/pub/wpgen.cgi?PGhtml=pub141_1.htm
18. 機關檔案管理資訊化作業要點, 檔案管理局九十年十二月十二日, (九○)檔秘字第○○○二○六六號函訂頒, http://www.archives.gov.tw/NAIInter/n07/n07_2_020.htm;
附表五 --- 電子檔案格式表, http://www.archives.gov.tw/NAIInter/n07/n07_2_020_5.htm
19. Open Source in Government, in Open Data Format Initiative,
http://odfi.org/
20. On Open Source Procurement Policies by Tony Stanco, http://www.newsforge.com/business/03/04/30/1926238.shtml?tid=19
21. Resolution for University Support of Open Software and
Standards,
Approved by
the Faculty Senate, University at Buffalo, State University of New
York, April
1, 2003, http://orange.math.buffalo.edu/csc/resolution2_april2003_approved.html
22. Using Open Source Software in the South African Government : a
proposed strategy compiled by the Government Information Technology
Officers's Council, http://www.oss.gov.za/docs/OSS_Strategy_v3.pdf
23. Use of Free Software in Government Agencies Law, http://www.opensource.org/docs/bill-EngTrans.php;西班牙文原文
24. Microsoft's "Fear, Uncertainty and Doubt" (F.U.D.) letter to
Peru concerning free and open source software, http://www.opensource.org/docs/msFUD_to_peru.php
25. Peruvian Congressman refutes Microsoft's "Fear, Uncertainty and
Doubt" (F.U.D.) concerning free and open source software, http://www.opensource.org/docs/peru_and_ms.php
26. GNU-PERU / Carta AmCham Perú, http://www.gnu.org.pe/text-amcham.html
27. GNU-PERU / Carta del Embajador EE.UU al presidente del Congreso
Peruano, 西班牙文原件影本, http://www.gnu.org.pe/lobbyusa-congreso.html
28. Microsoft makes donation to Peru, http://www.perutoyou.com/News%202002/news0715a.htm