政府機關每天產生許多文件, 並且透過各種機制散佈給公司行號, 社會大眾, 甚至其他政府機關。 如果這些文件必須特定軟體方能開啟, 便製造許多社會問題, 法律問題, 甚至進而影響我國國際形象, 成為外交問題。 現今並無明文規定, 但卻於現實生活中普遍使用的檔案格式, 正因為有著舊軟體無法開啟新檔案的問題, 以致文件接收者無論是否有功能上的需求, 皆被迫必須將軟體升級至與發送文件者相同, 或更高的版本。 於是:
數位落差的造成與軟體市場的壟斷, 實有相當大一部分肇因於封閉檔案格式的廣泛流傳。 對於弱勢族群之外的一般人, 寄送封閉檔案格式也是一種不尊重他人選擇的行為, 政府機關實應避免, 以免落人口實。 此外現今普遍使用之檔案格式尚有洩漏機密與隱私, 以及傳遞病毒等問題, 影響機關聲譽甚大。
因此, 行政院研究發展考核委員會制訂 「開放檔案格式規範」, 以促使資訊更加自由流通, 並提升政府不偏好特定資訊廠商之公正形象; 並促使機關首長與文件作者重視自身機密與隱私之保障。
本規範之目標在於促使機關全面採用開放檔案格式。
就人員面而言, 本作業規範對象包含
就活動面而言, 本作業規範涵蓋
(Q: 是否包含透過既有的公文交換系統交換檔案?)
就文件性質而言, 本作業規範涵蓋一般文書電子檔案。 本作業規範論及文件包含表格或靜態圖片狀況之處置, 壓縮與解壓縮之處置, 加密與解密之處置; 但並不涵蓋圖形/壓縮/加密檔案格式開放程度之討論。 本作業規範並不涵蓋聲音, 動態影象, 資料庫, 地理資訊, ... 等等多媒體與特殊領域資訊所構成之文件。
從執行實務面來看, 規範之徹底實行, 繫於執行者觀念之認同。 諸如德國慕尼黑等國際經驗顯示, 徒有法令規範與技術支援而無執行者之認同, 難以成功。 為使轉換作業順暢, 以下觀念務必確實溝通:
機關全員應對散佈封閉檔案格式所造成之社會問題有所認識。 從公德心的角度切入, 與環境保護/垃圾分類/節約用水/停止製造二手煙 等等議題產生共鳴, 使其接納多元, 尊重少數, 並對弱勢產生同理心。
機關首長應培養長遠之目光, 重視電子文件檔案之永續保存, 開放交換, 保護機密隱私, 尊重智慧財產權, 尊重弱勢等價值。 如有必要, 應犧牲文件的美觀與操作的便利, 以維護上述重要價值; 不宜為求文書處理版面之精確而犧牲上述重要價值。
文書處理宜採取 「內容與外觀分開處理 Separation of Content from Presentation」 之策略。 [1] 多數文書處理人員應以文件之內容與結構為主要工作內容, 不應負排版美觀之責。 透過諸如 cascading style sheet 等公開的排版技術, 機關內只需要有少數人員負責制訂排版原則 (對機器, 不是對人) 即可。 如此不僅可以透過組合相乘而非個別相加的效果, 減少人力的浪費, 更可以提高文件外觀的一致性。 此外, 文件外觀規範改變時, 只需要修改一處, 即可對所有文件生效。
文書處理軟體之採購/選擇, 應有以下觀念:
舉辦多場研習會/說明會, 加強溝通公德心等觀念。
針對選定之交換格式, 設計外觀規範 (style sheet) 或樣版文件 (template)。 詳見 「檔案格式開放化技術手冊」。
建議採用具有以下特性之軟體:
目前似以 Mozilla Composer, Nvu, OpenOffice.org Writer 等軟體較符合上述條件。 不畏懼技術細節者, 可選擇使用 vim, nano, notepad, ... 等等文字檔案編輯器, 有助於知識長久保存, 且應變彈性更大。
Tidy 是 w3c 發展的工具, 不僅可以將網頁修繕至符合 w3c 的標準, 亦可將 html 轉換成 xhtml 檔。 程式碼與說明文件均可自 w3c 的網站取得: http://www.w3.org/People/Raggett/tidy/
以下是 tidy 的設定檔範例
tidy-mark: yes markup: yes wrap: 72 tab-size: 8 indent: auto indent-spaces: 2 output-xhtml: yes doctype: loose char-encoding: raw clean: yes logical-emphasis: yes # write-back: yes 很危險, 請小心使用! keep-time: yes
由於 html 檔案的本文與圖形必須分開儲存, 所以傳送檔案之前宜先整合壓縮成單一檔, 較為方便。 用戶可自行選擇市面上任何產生開放壓縮格式之軟體。
對於需要大量轉換既有檔案的作業人員, 批次作業可能較為方便。 一個提供 「可組合指令」 的命令列是必備的環境。 (一般文書處理人員並不需要。)
cygwin 環境提供上述所有工具與環境。 這是在 Microsoft Windows
下模擬 UNIX 的作業環境, 程式碼與說明文件均可自
http://sources.redhat.com/cygwin/
取得。 以欲壓縮檔案為例, 假設 report/ 目錄下所有文件 (含本文與圖形)
應壓縮成單一檔案 report.tgz, 則可執行: tar czf report.tgz
report/
反之, 在接收端執行 tar xzf report.tgz
則可解壓縮。 又以欲進行批次轉換為例, 假設 archive/ 目錄下,
所有子目錄, 孫目錄, ... 當中之舊 html 檔案都應用 tidy 轉換成符合 w3c
規範的 xhtml 檔, 可以下: tidy `find archive/ -name
'*.*htm*'`
然後再進行人工細節修正。
由朝陽科技大學整理的 cygnuwin 光碟, 綜合了 cygwin 與英文版的 gnuwin 光碟, 並將部分軟體改以中文版取代, 裡面包含了上述 Mozilla Composer, OpenOffice.org Writer 與 tidy 等等軟體。 以下網址可找到更多資訊: http://www.cyut.edu.tw/~ckhung/a/c034.shtml
針對每一常用文件類型, 應製作一份範例, 裡面運用到常用標籤。 所有文書處理人員應避免自行指定字形行距等等外觀細節, 改而遵循一定之結構規範, 例如:
再針對此類文件, 製作一份外觀規範檔 (style sheet)。 本文件之外觀規範檔 可作為範例。
仍在使用 Microsoft Word 之作業人員, 應習於使用 「檔案 => 另存新檔」 功能, 並選擇 html 格式。 例如原始文件叫做 contract.doc 則存檔後會產生 contract.htm 檔, 即可寄送/張貼。 如果文件裡面還包含有貼圖, 則會產生一個 contract_files 的檔案夾。 此時需要用壓縮軟體例如 winzip 或上述 tar 指令, 將 contract.htm 與 contract_files 整個檔案夾 (含內部所有檔案) 壓縮起來, 即可寄送/張貼。
Microsoft Word 所存的檔案, 難以用既有工具處理成符合規範的 xhtml, 未來在與 xml 接軌時, 可能需要付出較大的代價。 且此軟體僅能在單一系列作業系統上使用, 不利於使用者長遠的學習投資, 宜即早改變使用習慣。
所有試算表軟體皆可產生/讀取簡單的 csv 格式 (comma separated values)。 此格式的優點是以純文字方式呈現, 甚至可用任何簡單文字編輯器開啟修改, 不夾帶病毒, 利於後續批次處理; 缺點是無法表達計算公式, 只能呈現計算結果。 適合一般不需要傳遞計算公式的交換場合使用。
特別值得一提的是它適合批次處理的特性。 以學校匯整教師成績為例, 其實已有許多教師使用試算表計算成績; 有些學校另外發展資訊系統, 要求教師重新自瀏覽器輸入, 並不符合自動化與效率原則。 若改以 csv 格式收取成績檔, 再搭配諸如 perl 等命令稿, 很容易用簡短的三幾個命令取代複雜的處理機制。 或許因為許多系統設計者僅知有 xls 等封閉試算表格式, 故完全忽略此高效率途徑之可能性, 至為可惜。
若是機關內部要長期保存, 並且必須保留計算公式, 則可考慮使用 sxc 格式。
在簡報製作方面, 目前不問實際需求, 一律盲目採用特殊簡報軟體的趨勢, 值得深思與檢討。 如果簡報的重點在充實的內容而不在華麗的外表, 改用 xhtml 其實已足以表達圖文表格等重要資訊。 更重要的是以此方式製作之簡報, 不需要倚賴特殊應用軟體。 不論在任何場合, 任何作業系統上, 只要有瀏覽器即可播放。 這對於講者的彈性與長遠觀點下的文件再利用, 都有極大的好處。