政府機關電子出版品及檔案格式的現況

毛慶禎 輔仁大學圖書資訊學系副教授
政府跨平台共通開放檔案格式規範研討會
2004/2/20 於輔仁大學
http://www.lins.fju.edu.tw/mao/works/govfile.htm

  1. 公眾資訊
  2. 資訊近用
  3. 封閉格式
  4. 電子出版品格式
  5. 電子檔案格式
  6. 開放標準
    1. 原則
    2. 特性
    3. 基準
  7. 國外案例
  8. 結論

1. 公眾資訊

政府機關出版品及檔案係公眾資訊,應開放給民眾閱覽、抄錄或複製。

在紙本的時代裡,侑於儲存媒體的複製成本及儲存空間,祗能採取寄存圖書館制度,將 政府 出版品置於特定場所,供民眾閱覽、抄錄或複製。政府檔案的內容及範圍較為瑣碎,直到1999年12月25日通過檔案法後,依法成立檔案管理局後,民眾才有 閱覽、抄錄或複製檔案的正式管 道。

在紙本的時代,民眾於申請閱覽、抄錄或複製檔案,應以書面敘明理由為之,各機關非有法律依據不得拒絕。政府機關的電子出版品及檔案,除了採用寄存制 度及各機關自行典藏供民眾申請閱覽、抄錄或複製外,還應採用開放的電子檔案格式,以確保與國家安全無關的政府資訊,能夠被民眾自由閱覽、抄錄或複製(註 1)。

本文檢視政府機關的電子出版品及檔案的特質,就電子檔案格式的開放性,討論永續典藏、閱覽及再利用的議題。

政府機關:指中央及地方各級機關(註2)。

政府出版品,係指以政府機關及其所屬機構、學校之經費或名義出版或發行之圖書、連續性出版品、電子出版品及其他非書資料(註3)。
受限於經費,寄存圖書館制度是紙本時代管理及應用政府出版品與檔案的唯一途徑。政府出版品與檔案已經電子化的前提下,透過網際網路的通道,置於開放 近 用的伺服器,是有效運用政府出版品與檔案的最佳策略。

檔案:指各機關依照管理程序,而歸檔管理之文字或非文字資料及其附件(註4)。

1990年代末期以來,政府機關的出版品及檔案均以電腦製作,先有電子檔案再印成紙本,然而,基於技術及觀念的限制,實務上仍以紙本為正本。主管政 府機關檔案的單位是 行政院研究發展委員會檔案局,在其相關作業規定裡,仍以紙本的檔案為正本,再轉製為電子檔案(註5)。

2. 資訊近用

政府機關有責任將不涉及國家安全的出版品及檔案,以最大的可能讓民眾使用。

在紙本時代的寄存圖書館制度及至各機關抄錄檔案的做法,人民的資訊近用權被科技所限,無法完全發揮。在網際網路的時代,電子出版品及檔案的複製及傳播趨近 於零,祗要置於公眾可以近用的伺服器裡,即使沒有編製索引,使用者仍可透過功能強大的搜尋引擎,自由的近用該等資訊。

開放的電子檔案格式是保障資訊近用的基礎,自由軟體一定採用開放的電子檔案格式,確保資訊的持久性。

1970年成立的古騰堡計畫,以純文字檔建立無著作財產權爭議的作品,三十多年來,已完成一萬多種經典名著。

3. 封閉格式

聯合國教科文組織曾指出,現有的思惟模式,將導致電子方式呈現的人類知識無法傳承;必須一併保 存伴隨的硬體及軟體,在不可知的未來, 才有機會讀取該等電子資料的內容。

2001年7月27日,美國南加州大學(University of Southern California)神經生物學家約瑟夫•米勒(Joseph Miller)因研究需要,向美國航太總署申請檢視維京探險計畫(Viking Probe)於1970年代中期取得的火星資料;赫然發現,已有25年歷史的該等電腦檔案,已經無法讀取,當初撰寫該檔案格式的軟體工程師,已經往生或無 法再回頭檢視當年的工作,旁人也無法解讀當年的程式原始碼(註6)。

以授權條款封閉的電子檔案格式,有相當的市場佔有率,以此格式製作的檔案,需要特定的軟體及硬體才能夠讀取其內容,它的缺點已經被指出(註7):

  1. 需要專制軟體
  2. 版本不相容
  3. 專制檔案格式
  4. 散布病毒及安全漏洞
  5. 龐大繁重
  6. 洩漏編輯過程
為了保障民眾的資訊權,政府機關的電子出版品與檔案不能被特定廠商的編碼方式限制;為了保障政府機關的電子出版品與檔案的持久性,讀取政府機關的電 子出版品與檔案的軟體不能仰賴廠商的善意。基於公眾的利 益政府機關的電子出版品與檔案訊必須 以開放檔案格式儲存(註8)。

因此,《我不用.doc檔》已是全球的共識(註9),替代方案甚多,針對檔案的用途及特性,可以擬出通用的開放檔案格式。

4. 電子出版品格式

電子出版品的格式依照2002年發布的《政府出版品電子檔繳交作業規定》進行,其要旨如下(註10):
公報應採用純文字電子檔,圖書都應具備電子檔,圖書館可轉製成可攜式文件檔,字型以華康字及文鼎字為原則,網頁採用JPEG或GIF檔,內碼採用Big-5碼。

在近用方面,也有一些規定:

國家圖書館典藏公報的電子版,圖書的電子檔應繳交予 行政院研究發展考核委員會,可以被他人利用及再利用,可以展售已出版的圖書。

5. 電子檔案格式

1998年由行政院研究發展考核委員會發佈之政府出版品管理辦法(註11),是管理政府出版品的主要依據,依該辦法第四條訂定之政府出版品基本形制注意事 項,在第 六項規定:電腦檔案格式請依照「文書及檔案管理電腦化作業規範」、「機關檔案管理資訊化作業要點」等相關規定辦理

2001年12月,由行政院研究發展考核委員會檔案管理局訂頒之機關檔案管理資訊化作業要點,在附表五 - 電子檔案格式表,訂出文字檔、圖片檔、聲音檔、視訊檔、工程圖檔、文字影像檔等六類檔案格式(註12)。

類型

格式

說明

文字檔

XML

一、開放性標準。

二、電子公文傳遞交換格式。

PDF

一、業界認定可攜性文件格式,軟體功能齊全。

二、文書及檔案案管理作業規範所定文字檔格式。

圖片檔

JPEG

如檔案係以影像掃描製作,一律採全彩,壓縮品質為75%以上 ,解析度300 DPI以上。二、開放性標準。

聲音檔

MP3

開放性標準。

WAV

一、開放性標準。

二、文書及檔案案管理作業規範所定聲音檔格式。

視訊檔

MPEG-2

一、開放性標準。

二、文書及檔案案管理作業規範所定動態影像格

AVI

專屬軟體。

工程圖檔

IGES

美國國家標準(ANSI Y14.26M)。

DXF

開放性標準。

STEP

國際標準(ISO/IEC10303)。

文字影像檔

JPEG

一、彩色影像:採全彩,壓縮品質為75%以上,解析度200 DPI以上。

二、開放性標準。

TIFF

灰階影像:採解析度200 DPI以上。

TIFF

一、黑白影像:採CCITT G4標準,解析度300 DPI以上。

二、業界認定開放性標準。

原註:本表所定規格,指保存為主之電子檔案,如係為開放應用,得考量儲存空間、傳輸效率等因素,予以壓縮 或其他適當方式處理,但以目視清晰為原則。

文字檔的XML、圖片檔的JPEG、聲音檔的MP3及MAV、視訊檔的MPEG-2、工程圖檔的IGES, DXF, STEP、文字影像檔的JPEG及TIFF等格式,被認定屬於開放性標準的範圍,即屬於廣義的開放檔案格式。

歸納出六種附件檔案類型:

公文文書電子檔包括公文本文檔及附件檔,公文本文檔的格式及組成欄位參見文書處理手冊,公文附件類型分為:文字檔、靜態圖形檔、工程圖檔、動畫檔、 聲音檔、動態影像檔、紙本文件及無法電子化之實物等。已電子化之附件按參之二、附件採用格式傳送。

行政院研究發展考核委員會以12項準則,評估公文電子交換之共同傳輸檔案格式:

  1. 規範共識程度
  2. 產品可獲得性
  3. 規範穩定性
  4. 規格完整性
  5. 技術成熟性
  6. 業界使用狀況
  7. 使用自由度
  8. 作業之效率性
  9. 資料之再用性
  10. 格式之可擴充性
  11. 系統之整合性
  12. 文件之呈現方式

最後決定採用可擴充之標示語言(eXtensible Markup Language, XML),並據以制定公文電子交換和處理之技術規範。

6. 開放標準

制定開放的電子檔案格式時,必須依循開放標準的規定,且在應用該標準的實務上,朝向開放的方向思考。

6.1 原則

開放標準的原則有六:可及性、使用者的選擇權、 免授 權費、無歧視、擴展或縮限、掠奪市場(註13及14)。

一、可及性 Availability

可以被任何人閱讀及應用;因此:

  1. 該開放標準及相關應用必須可以經由網際網路自由下載;
  2. 相關軟體應在可以負擔的原則下複製,其成本不應超過教科書的價位;
  3. 不得限制相關文件的授權;
  4. 軟體的參考平台必須與自由軟體及專制軟體的授權相容。

二、使用者的選擇權 Maximize End-User Choice

開放標準的目標是建立公平、有競爭力的市場,不可使用者鎖在特定的範圍裡。因此,開放標準應:

  1. 允許商業性、學術性及公益性用途;
  2. 支援各種售價模式,從極貴到免費。
三、免授權費 No Royalty

任何人都可免費使用開放標準,沒有授權費,標準組織得向申請認證的使用者收取認證費用。因此:

  1. 開放標準裡的專利必須無授權費,且沒有歧視條款;
  2. 必須有低價或免費的自我認證模式,也允許高價的另種認證。
四、無歧視 No Discrimination

祗從技術觀點審視開放標準,不可偏袒任何應用者;認證單位必須提供可行的低價或免費的基本認證。因此:標準組織的認證應有額外認證及平價認證兩種管 道。額外認證由標準組織強化廠商的產品,平價認證由廠商自我認證。

五、擴展或縮限 Extension or Subset

廠商可以擴展或縮限使用開放標準,認證單位依照使用的開放傾向,得拒絕或接受該等擴展或縮限。

六、掠奪市場 Predatory Practices

在保護開放標準本質的前提下,不得限制開放標準的擴展,祗要求廠商以授權方式,出版擴展開放標準的資訊,與該等擴展有關的軟體製作、散布及銷售。昇 陽公司的產業標準原始碼授權(Sun Industry Standards Source License),要求擴展標準的內容,必須公開出版,在不介入個別發明的前提下,保障彼此的互通性。

6.2 特性

電子檔案格式很多,難以計算(註15),能夠找到規格書的電子檔案格式,祗是其中的少數(註16)。

即便採用公平合理授權(Reasonable And Non-discriminatory)方式,並不能保障使用者的權利,使用者沒有能力逐一查證或瞭解授權的實情,往往在事後才被廠商指出侵權的所在(註 17)。

以部份或全部以任何格式再利用為出發點,在開放標準架構下制定的電子檔案格式,必須具備下列特性(註18),才堪稱開放電子檔案格式:
  1. 內容完整,具備相當知識的人,可以依此文件製作讀取及寫作該等電子檔案的軟體
  2. 規格公開,不能有隱藏的協議、費用或妨礙自由出版的障礙,必須免費散布。製作讀取及寫作該等電子檔案的軟體,不被任何技術專利及授權所阻隔。
  3. 完全合法,允許讀、寫、複製及刪除資料,而不違反任何法律。
  4. 向後相容,新版規格必須相容於舊版規格,允許手動或自動讀取及寫入前版的電子檔案。
  5. 獨立自主,開放的電子檔案格式不得依附於特定的載體或硬體,可在任何情況下呈現、解譯、解壓縮、解碼。

6.3 基準

因此,從六個基準判斷電子檔案格式的開放性:規格書、法律授權、上下相容、軟體豐富、轉換多元、搜尋便利。

規格書

公開的檔案格式規格書(file format specification)是確保資訊內容可以自由交換/轉換/流傳/保存的基礎。以公開規格書的電子檔案格式製作文件,製作者或閱讀者隨時可以運用該 等檔 案,不需要檔案規格書制定者的善意與配合。

依據規格書的公開程度, 將檔案格式分為以下等級: 法律授權

允許任何公司或個人撰寫製作及讀取該等檔案的軟體。 即使規格書可以取得, 若有特殊法律障礙阻止程式設計師撰寫相容程式, 社會大量採用這樣的格式還是有相當大的危險性。

依據不同的法律障礙程度, 將檔案格式分為以下等級:

上下相容

最新的影像手機可以與古老的電話機互相通話 (當然影象無法顯示); 最新的 DVD 播放器可以將視訊傳送到古老的電視機, 這些都是上下相容的例子。 理想的檔案格式, 不只要讓新軟體可以讀舊格式, 還應該讓舊軟體能夠讀新格式裡舊規格的靜態圖/文, 不可完全拒絕開啟新文件。

依據不同的「新舊版本相容程度」, 將檔案格式分為以下等級:
軟體豐富
製作及閱覽該檔案格式的軟體,應該有豐富的多樣性,從多種角度發揮該檔案格式的特性,讓使用者有多重的選擇機會。

其內容的豐富性,可以從幾個角度觀察:
轉換多元

檔案的內容有多種呈現方式,不以單一格式為限,該檔案格式應允許軟體將其轉換為其他的檔案格式。
搜尋便利

以簡單方式進行批次搜尋 (例如一次在數千個檔案裡面搜尋特定字串),是搜尋的考慮要點。

因此,符合下列方式編碼的電腦資料,才可被稱為開放檔案格式(註19) :
  1. 永久自由使用,沒有授權金等任何費用;
  2. 無限制使用該格式儲存的資料;
  3. 無限制地製作軟體,以儲存、傳送、接收或近用該等格式資料;
  4. 以通行的技術用語,寫成的規格文件;
  5. 完整的文件,任何人得以據此製作軟體,閱讀及解譯該格式資料的全文;
  6. 資料格式的擴展必須有清楚的文件,沒有任何隱藏的特生;
  7. 以該格式製作的檔案,必須可以清楚的辨識)。
開放性、一致性、正當性及智慧財產權公開性,已是公認的普世價值;開放近用性、會議公開性、持續性、介面開放性、開 放使用性等屬性,還在啟萌的階段,還需要相當的時日,才可能被大家接受(註20)。

7. 國外案例

各國對電子檔案格式的態度不一,甚少理解到此議題對國家安全、知識傳遞的影響,美國若干單位已經提出具體方式,秘魯及南非已經透過立法的程序,要求 政府採用自由軟體製作公文書,保障當代及後代子孫的資訊權不致因為電子檔案的格式而受影響。

美國的Oregon、Texas、Oklahoma、California、New York City等州級政府,南美洲的秘魯、南非等國家已經完成立法程序,要求官文書及公眾資訊必須以開放檔案格式儲存,以保障人民的資訊權(註21)。

美國紐約州

2003年4月29日,美國紐約州議會就該州採用自由軟體事宜辦理公聽會,邀請專家做證,提出七項意見,主張採用自由軟體(註22):

幾乎同時,紐約大學(State University of New York)教師會通過支持自由軟體的決議,清楚指出(註23):

美國奧克拉荷馬州

2003年1月15日,美國奧克拉荷馬州議會立法,要求:
州政府機關及採購中心於簽署任何買賣電腦軟體的合約,必須要求廠商提供該軟體的原始碼。

雖然沒有指明需採用開放的電子檔案格式,實質上可以根據提供的原始碼,解讀出該等軟體使用的電子檔案格式。

南非

2003年元月,南非共和國提出於政府機關使用自由軟體的策略規畫(Using Open Source Software in the South African Government),認為政府機關採用自由軟體的關鍵有三:產生價值、使用能力、支援意願(註24)。

政府機關應該採取幾個步驟,確保自由軟體的成功:
  1. 採購軟體時,不能歧視也不能有成見,必須以開放的心面對自由軟體及專制軟體。
  2. 開放標準,包括開放檔案格式在內,是發展軟體工業的必要條件。

秘魯

從2001年11月開始,秘魯國會通過數個法案(註25),要求政府機關使用自由軟體;其主要原則為:
特別看重開放的電子檔案格式,認為是採用自由軟體的主要效益。

2002年3月21日,秘魯微軟公司總經理致函推動該等法案的國會議員(註26),一方面重申該法案對軟體的安全及保固沒有保障,又指出可能侵害第 三者的智慧 財產權;並且暗示微軟的產品仍有降價空間。

秘魯國會議員以一封更長的回函反駁微軟的論點(註27),並指出微軟公司的開放源碼政策,祇是文字遊戲,並不符合於自由軟體或開放源碼促進會的精 神。

同年5月27日,在秘魯的美國商會總經理致函秘魯國會議長(註28),警告轉換自由軟體的代價甚高,軟體成本祗佔總費用的少部份,政府已從使用商業 軟體取得相 當好處,以及自由軟體沒有足夠的後續服務。

2002年6月間,美國駐秘魯大使分別致函給秘魯國會議長等人(註29),先是談到秘魯軟體業者的15,000個工作機會,又提到外國的投資意願。

同年7月15日,微軟公司捐贈價值55萬美元的軟體及服務給秘魯政府(註30),做為推動電子化政府之用。

這些政商結合的遊說行為,使相關法案難產,已通過的法案也難以具體執行。

8. 結論

在行政院研究發展考核委員會的規畫下,現有的法令已經朝向開放檔案格式的方向前進,政府機關有足夠的依據拒絕使用專制的檔案格式,電子出版品及檔案 採用開放格式的技術已經起步。

公眾資訊不以政府機關出版品及檔案為限,意圖供社會大眾使用的任何出版品及檔案,都屬於公眾資訊的範圍,減少近用公眾資訊的障礙是製作及出版公眾資 訊者的責任。

數位落差的成因及解決途徑,有兩種思考角度:人口統計學及資訊近用。

以人口結構區分,加強偏遠地區、弱勢團體、婦女團體等單位的基礎建設,是各國用來縮短數位落差的手段,具有短期的效果。從資訊近用的角度努力,改善 公眾資訊的普及性,消除公眾資訊的技術障礙,是縮短數位落差的根本之道。

附註

  1. 毛慶禎,「政府資訊自由化」,全國新書資訊月刊,45期(2002年9月), 頁 59。
  2. 檔案法,中華民國八十八年十二月十五日 總統華總一義字第八八00二九七四八0號 令制定公布全文三十條, 中華民國九十年十一月二日 行政院台九十秘字第0六三八八二一號函定自中華民國九十一年一月一日施行, http://www.archives.gov.tw/NAIInter/n07/n07_1.htm
  3. 政府出版品管理法, 中華民國八十七年十一月四日行政院台八七研版字第○四五五一號令發布, 中華民國九十年十二月十日行政院台九○研版字第○○二六七一五之一號令修訂, http://gpnet.nat.gov.tw/pub/wpgen.cgi?PGhtml=pub141_1.htm
  4. 檔案法,中華民國八十八年十二月十五日 總統華總一義字第八八00二九七四八0號 令制定公布全文三十條
    中華民國九十年十一月二日 行政院台九十秘字第0六三八八二一號函定自中華民國九十一年一月一日施行, http://www.archives.gov.tw/NAIInter/n07/n07_1.htm
  5. 檔案電子儲存管理實施辦法, 檔案管理局九十年十二月十二日 (九○)檔秘字第○○○二○五四之三號令發布, http://www.archives.gov.tw/NAIInter/n07/n07_2_019.htm
  6. Report by the Director-General on a Draft Chapter on the Preservation of the Digital Heritage, by Unesco, 164 EX/21 9 April 2002, http://unesdoc.unesco.org/images/0012/001255/125523e.pdf
  7. Goldberg, Jeff, MS-Word is Not a document exchange format. http://www.goldmark.org/netrants/no-word/attach.html
  8. Sample Open Data Format Bill: Open Data Format Initiative: Version 2, August 05, 2003, http://odfi.org/archives/000025.html
  9. 洪朝貴,我不用.doc檔, http://www.cyut.edu.tw/~ckhung/a/c_91.shtml
  10. 政府出版品電子檔繳交作業規定, 中華民國九十一年五月七日行政院研究發展考核委員會會版字第0910010025號函發布
  11. 同註3。
  12. 機關檔案管理資訊化作業要點, 檔案管理局九十年十二月十二日, (九○)檔秘字第○○○二○六六號函訂頒, http://www.archives.gov.tw/NAIInter/n07/n07_2_020.htm; 附表五 --- 電子檔案格式表, http://www.archives.gov.tw/NAIInter/n07/n07_2_020_5.htm
  13. Open Standards: Principles and Practice, http://perens.com/OpenStandards/Definition.html
  14. Krechmer, Ken(1998), The Principles of Open Standards / by , Standards Engineering, Vol. 50, No. 6, November/December 1998, p. 1-6, http://www.csrstds.com/openstds.html
  15. "Every File Format in the World", http://whatis.techtarget.com/fileFormatA/0,289933,sid9,00.html
  16. The Programmer's File Format Collection, http://www.wotsit.org/
  17. Patents and Open Standards, http://xml.coverpages.org/patents.html
  18. Open file format definition, from Texas Open Source Initiative Mailing Listhttp://www.anansispaceworks.com/Documentation/BuildImage/Legal/tosi.openformatdef.2003.03.19.html
  19. Sample Open Data Format Bill: Open Data Format Initiative: Version 2, August 05, 2003, http://odfi.org/archives/000025.html
  20. Krechmer, Ken(2002), Cathedrals, Libraries and Bazaars, In Proceedings of the 17th Symposium on Proceedings of the 2002 ACM Symposium on Applied Computing, ACM Press, 2002, p. 1053-1057
  21. Open Source in Government, in Open Data Format Initiative, http://odfi.org/
  22. On Open Source Procurement Policies by Tony Stanco, http://www.newsforge.com/business/03/04/30/1926238.shtml?tid=19
  23. Resolution for University Support of Open Software and Standards, Approved by the Faculty Senate, University at Buffalo, State University of New York, April 1, 2003, http://orange.math.buffalo.edu/csc/resolution2_april2003_approved.html
  24. Using Open Source Software in the South African Government : a proposed strategy compiled by the Government Information Technology Officers's Council, http://www.oss.gov.za/docs/OSS_Strategy_v3.pdf
  25. Use of Free Software in Government Agencies Law, http://www.opensource.org/docs/bill-EngTrans.php西班牙文原文
  26. Microsoft's "Fear, Uncertainty and Doubt" (F.U.D.) letter to Peru concerning free and open source software, http://www.opensource.org/docs/msFUD_to_peru.php
  27. Peruvian Congressman refutes Microsoft's "Fear, Uncertainty and Doubt" (F.U.D.) concerning free and open source software, http://www.opensource.org/docs/peru_and_ms.php
  28. GNU-PERU / Carta AmCham Perú, http://www.gnu.org.pe/text-amcham.html
  29. GNU-PERU / Carta del Embajador EE.UU al presidente del Congreso Peruano, 西班牙文原件影本, http://www.gnu.org.pe/lobbyusa-congreso.html
  30. Microsoft makes donation to Peru, http://www.perutoyou.com/News%202002/news0715a.htm