接近使用數位典藏國家型科技計畫成果
- 無障礙網路空間、檔案格式的影響
毛慶禎 輔仁大學圖書資訊學系副教授 Mao, Ching-Chen
http://www.lins.fju.edu.tw/mao/works/20041220.htm
2004/12 for 數位典藏國家型科技計畫
- 接近使用資訊權
- 數位資訊的呈現工具
- 網頁
- 檔案
- 網頁的障礙性
- 障礙的內容
- 修改示範
- 編輯工具
- 檔案的封閉性
- 檔案種類
- PDF
- PostScript
- RTF
- Tex
- 純文字檔
- SGML
- 微軟規格
- JPEG
- TIFF
- 開放的程度: 完全封閉、要求授權(可讀不可寫、可讀可寫)、完全公開
- 格式標準: 內部標準、業界標準、國家標準、國際標準
- 編輯工具
- 公版著作及開放近用著作
- 結論及建議
- 使用開放格式儲存檔案
- 建置無障礙網頁
- 使用自由軟體
- 資訊素養
1. 接近使用資訊權
資訊權是人權的一部份。
無障礙網路是Web content accessibility的中譯, 係指不論是否殘缺, 每個人都擁有存取網路資源的權力。
萬維網聯盟(The World Wide Web Consortium﹐W3C)的香港辦事處設在九龍清水灣香港科技大學計算機科學系辦公室, 由沈運申教授擔任經理。
萬維網聯盟從架構、互動、科技與社會、Web Accessibility 先導計劃等四個領域, 促進網站的發展與互用性(interoperability), 及特別著重網頁的普遍性。
部份人士無法使用網路內容:
- 具有視覺、聽覺、行動等障礙, 無法使用部份或全部內容
- 具有閱讀障礙
- 不能使用鍵盤或滑鼠
- 螢幕祗能顯示文字, 過小, 或窄頻上網
- 不能瞭解文件的語文
- 無法騰出眼、耳或手操作電腦, 開車中、吵雜環境等
- 使用較早版本的瀏覽器、或不同的瀏覽器、語音瀏覽器或不同的作業系統
無障礙網路包括:
- 網站和應用程式
- 瀏覽器和媒體撥放程式
- 可以讓殘障的人有效的使用﹐而且
- 藉由輔助的技術的幫助﹐讓殘障的人可以存取網站﹔
- 網路編輯工具與發展中的網路技術
- 可以用來開發容易存取的網站內容或網站,並且
- 可以讓殘障者更有效率的使用。
針對不同類型殘障人士需要的設計﹐包括﹕
- 視覺上﹕
- 聽覺上﹕
- 身體上的﹐說話能力﹔
- 在語音入口網站﹙voice portals﹚上提供語音輸入的替代方案﹔
- 認知上﹐精神上﹕
- 一致的導覽模式﹐使用恰當的語言程度﹔
- 圖示說明﹔ 不要有閃爍、搖曳的版面設計。
因為 Web accessibility 的問題涉及不同層面﹐而 WAI 的工作也有5個層面﹕
- 確定 Web 技術支援可存取性
- 發展可存取性的指導原則
- 改善評估與修繕 Web accessibility 的工具
- 製作教育與推廣的內容與教材
- 與研究發展整合
在製作一個具有可存取性的網站時﹐指導方針扮演著關鍵性的腳色﹐它將解釋﹕
- 如何創造一個可存取﹙具親和力﹚的網站﹐
- 如何設計可以支援具親和力的網站成果的軟體﹐
- 如何設計有親和力的瀏覽器﹐或是編輯工具﹐
- 如何設計支援可存取性的 XML 應用程式。
WAI 有 4 個不同的指導原則來說明各種需要﹕
WCAG 1.0 在執行上擁有廣泛的資源的支援﹐包括﹕
2. 數位資訊的呈現工具
2.1 網頁
2.2 檔案
檔案有兩類用途:
前者看重版面的固定性, 後者在意內容的長遠保存
3. 網頁的障礙性
3.1 障礙的內容
以14種規範檢測網頁的障礙:
- 規範一:對於聽覺及視覺的內容要提供相等的替代文字內容
- 規範二:不要單獨靠色彩來提供特殊資訊
- 規範三:適當地使用標記語言和樣式表單
- 規範四:闡明自然語言的使用
- 規範五:建立編排良好的表格
- 規範六:確保網頁能在新科技下良好地呈現
- 規範七:確保使用者能處理時間敏感內容的改變
- 規範八:確保嵌入式使用者介面具有直接可及性
- 規範九:設計裝置獨立網頁
- 規範十:使用過渡的解決方案
- 規範十一:使用國際與國內官方訂定的技術和規範
- 規範十二:提供內容導引資訊
- 規範十三:提供清楚的瀏覽網站機制
- 規範十四:確保簡單清楚的網頁內容優雅轉換:
前11條規範, 以優雅轉換內容為主:
- 結構與外觀分離
- 提供文字內容
- 不能看、不能聽時, 仍可提供相當的訊息
- 與硬體分離的內容, 無滑鼠、小尺寸螢幕、低解析度螢幕、黑白螢幕、無螢幕祗有語音或文字輸出。
12至14條規範, 協助內容平易及可瀏覽性, 不祗是文字淺顯, 還需有在網站內外瀏覽的機制,
才能強化無障礙性及可用性。並不是所有的使用者都是明眼人, 對圖片、捲軸、頁框等連結, 一目瞭然; 部份使用者祗能看到部份網頁內容, 如:
使用語音合成器、點字顯示器、小尺寸螢幕、放大螢幕等。
3.2 修改示範
3.3 編輯工具
W3C訂用製作工具近用指南(Authoring Tool Accessibility Guidelines), 制定七個規範22條檢測碼, 分為三個檢測等級。
- 發表用來建置網站的軟體﹐包括﹕
- WYSIWYG 編輯器﹔editors;
- 轉換工具﹙word 處理器,簡報軟體﹚﹔
- 從資料庫動態產生網頁的工具﹔
- 繪圖軟體、網站管理工具 ﹔
- 發表的議題包括﹕
- 建立有效驗證的﹙valid﹚內容﹔
- 制定推廣、示警、協助與驗證的策略﹔
- 使用者介面的可存取性議題。
符合檢測的製作軟體有六類:
4. 檔案的封閉性
應用軟體制定檔案格式, 將位元轉換為有意義的資料, 供使用者檢視及操作。應用軟體廠商不見得採用開放的標準檔案格式, 也不會公開其專屬的檔案格式, 即使公開其檔案格式, 內容也不見得是正確的。
- Risk Management of Digital Information: A File Format Investigation / Gregory W. Lawrence, William R. Kehoe, Oya Y. Rieger, William H. Walters, and Anne R. Kenney, Washington, D.C., Council on Library and Information Resources, 2000, ISBN 1-887334-78-5, p.13-15 (Lotus 1-2-3, TIFF) http://www.clir.org/pubs/abstract/pub93abst.html
有人計算過, 在Unix、Mac、OS2、MS Windwows等作業系統下, 由應用軟體自動產生的延伸檔名, 超過一萬種。
長期而言, 採用專制的格式(proprietary file formats)的電子檔案, 有潛在的危機。
4.1 檔案種類
製作及使用檔案的工具必須可及(便宜)且容易, 必須對呈現的格式有控制能力。
英國電子典藏所計畫(The ePrints UK Project)接受的檔案類型為(p. 26):
- Portable Document Format (PDF)
- Rich Text Format (RTF)
- PostScript
- TeX
- LaTex
- ASCII
- HTML
- XML
- MS Word
- MS PowerPoint
- James, H., Ruusalepp, R., Anderson, S. and Pinfield, S. (2003),
Feasibility and Requirements Study on Preservation of E-Prints: Report
Commissioned by the Joint Information Systems Committee (JISC) October
29, 2003, p. 26, http://www.jisc.ac.uk/uploaded_documents/e-prints_report_final.pdf
蘇格蘭格拉斯哥大學電子典藏所(Glasgow ePrints Service)祗接受下列六種格式的檔案:
* HTML
* Rich Text Format
* Adobe Acrobat PDF
* Postscript
* XML DocBook
* XML TEI
美國加州大學學術資訊數位典藏所(University of California Digital Repositories)祗接受PDF格式。
英國英國聯合資訊系統委員會(Joint Information Systems Committee, JISC)
圖檔的規格,
聲音檔的規格,
4.1.1 PDF
可攜式文件格式(Portable Document Format, PDF)是Adobe公司繼PostScript之後推出的檔案格式, 以原樣重現文件格式為目標。1993年以來, 已公開其規格, 並可免費取得, 最近發展出由PDF轉換為XML的工具。
不過, 仍是由Adobe公司獨家掌控, 祗能算是業界標準, 內容複雜且隨時更動, 標籤及字型的運用方式, 仍有若干技術上的爭議。
它的優點是: 檔案規格公開、市場接受度高、跨平台使用、可轉換至XML。其缺點是: 檔案規格由一家公司掌握、經常更改規格(FCLA, 2003)、製作工具太少、早期版本無從轉換。
4.1.2 PostScript
1985年由Adobe公司製作, 供雷射印表機讀取的檔案格式, 其優缺點類似於PDF。
4.1.3 RTF
微軟公司製作維護的Rich Text Format, 其規格公開, 可視為業界標準。
它的優點是: 檔案規格公開、市場接受度高、跨平台使用、相容性高。其缺點是: 檔案規格由一家公司掌握、經常更改規格。
4.1.4 TeX
適用於理工文件, 1978年, 由史丹福大學的Donald E. Knuth發展, 以印表為主, 螢幕顯示較為不易。LaTex是Tex的巨集版。
它的優點是: 檔案規格公開、跨平台使用。其缺點是: 原為專屬規格發展成多種版本、需要特別的軟體。
4.1.5 純文字檔
7位元或8位元的ASCII、Unicode等國際標準編碼, 或Big5等業界標準構成的檔案, 無法處理文件的格式。
它的優點是: 檔案規格為國際標準、跨平台使用。其缺點是: 不能處理文件格式。
- ISO/IEC 646:1991, 7-bit coded character set for information interchange
- ISO/IEC 8859:1998-2003, 8-bit single-byte coded graphic character sets -- (Part 1-16, 1998-2003), without Part 12.
-
ISO/IEC 10646:2003, Universal Multiple-Octet Coded Character Set (UCS)
- Unicode, http://www.unicode.org/
4.1.6 SGML
祗要它的文件格式定義(Document Type Definition, DTD)與文件一同保留, 就是保證安全的檔案格式; HTML及XML也是如此。
它的優點是: 檔案規格公開且標準化、跨平台使用、檔案結構容易瞭解、使用純文字容易保存。其缺點是: 檔案規格還在發展中、需要伴隨的文件格式定義、祗能用於文字、外部物件不易保存。
- ISO/IEC 8879:1986, Standard Generalized Markup Language (SGML)
- HTML 4.01 Specification, W3C Recommendation 24 December 1999, http://www.w3.org/TR/html401/
-
Extensible Markup Language (XML) 1.0
(Third Edition),
W3C Recommendation 04
February 2004, http://www.w3.org/TR/REC-xml/
- ISO/IEC 15445:2000, HyperText Markup Language (HTML)
4.1.7 微軟規格
專屬的檔案規格, 部份版本向後相容, 但無法保證其相容的時效性。微軟提供的資訊祗限轉入其檔案規格。
它的優點是: 檔案規格市場佔有率高、與部份軟體相容、轉入XML的工具正在發展。其缺點是: 專屬檔案規格且不公開、還在發展中且變動甚快。
4.1.8 JPEG
聯合影像專家小組(Joint Photographic Experts
Group, JPEG)是圖像的失真壓縮法之一, 原來是專屬檔案規格, 1998年開始的JPEG 2000, 預計有16個部份,
前四個部份已經完成, 並成為國際標準之一, 其他的部份尚在進行中。
4.1.9 TIFF
標誌圖形檔案格式(Tag Image File Format, TIFF)是圖像無失誤壓縮法之一, Aldus及微軟公司為了將掃瞄檔案讀入桌上出版系統而開發的檔案格式, Aldus被併入Adobe後, 由Adobe擁有該格式, 公開成為業界標準。
4.2 開放的程度: 完全封閉、要求授權(可讀不可寫、可讀可寫)、完全公開
從可及性及穩定性分析, 檔案格式可以分為三種: 專屬、開放、標準。
專屬檔案格式(proprietary file
formats)由軟體廠商發展及維護, 不對外公開, 其市場佔有率達到相當程度後, 被歸類為業界標準(de facto standard),
如: Big5字碼。部份廠商可能對外公開其檔案格式, 以產生彼此相容的產品, 稱為開放檔案格式(open or
public file formats), 如: PDF。有些檔案格式成為國際標準稱為標準檔案格式(standard
file formats), 每個版本的內容都是公開穩定的, 如: HTML; 有些廠商以標準檔案格式為基礎, 另外加入其專屬不公開的內容,
如: 微軟公司的XML版本。
以開放標準為基礎的檔案格式, 如: XML為基礎的格式, 才能降低風險。長遠來看, PDF及RTF還是有點爭議, 以它們的普及性而言, 應該是可以接受的。電子典藏所除了文字之外, 還包括: 資料庫、聲音、影像等檔案, 其需求更為繁瑣。
4.3 格式標準: 內部標準、業界標準、國家標準、國際標準
檔案的規格:
4.4 公版著作及開放近用著作
5. 結論及建議
5.1 使用開放格式儲存檔案
即使採用轉換及模擬軟體, 資料的失漏及成本的負擔都是難以估算。
有幾項策略可以遵行:
-
瞭解各種檔案格式的風險
-
採用開放的標準檔案格式
-
檢視XML為基礎的檔案格式及後設資料
-
轉換罕見及過時的檔案格式
-
保留檔案格式的資訊
英國檔案局的PRONOM計畫保留部份檔案格式的資訊。
-
建立檔案格式認證制度
支援開放典藏促進會後設資料擷取協定(Open Archives Initiative Protocol for Metadata Harvesting, OAI-PHM), 共享有關檔案格式的後設資料。
5.2 建置無障礙網頁
檢測現有網頁的近用性,
Evaluating Web Sites for Accessibility, http://www.w3.org/WAI/eval/
提供五項步驟:
Evaluation Template
Evaluation Tools
Review Teams
Implementation Suite +
Training Suite +
網頁近用訓練有四個步驟:
- Determine audience's objectives
- Find out audience's needs and expectations in advance.
- Establish learning objectives with training host.
- Develop curriculum
- Review hypothetical curriculum outlines for different audiences.
- Choose training modules
- Choose training modules to meet selected learning objectives.
- Examine other trainers' perspectives
- Read these tips from a variety of trainers.
- Set up resources in advance
- Consider online or off-line presentation modes.
- Arrange equipment and software.
- Order W3C/WAI materials in advance.
- Check need for accessible formats.
- 用style sheets控制字型, 不要使用FONT細目。
- 在第一個規範裡, 用文字描述每個非文字的細目, alt、longdesc
- 文字才能被語音合成器發音、點字輸出、大字顯示
- 精準描述圖片的作用
- 建立搜尋引擎的資料庫
5.3 使用自由軟體Dive Into Accessibility
在 30 天內打造更具親和力的網站
http://dia.z6i.org/table_of_contents.html
FCLA-Digital Archive: File Format Information, http://www.fcla.edu/digitalArchive/daInfo.htm