項目介紹

項目名稱:香港轉用ISO/IEC 10646的基礎模塊-- 香港字形及輔助工具 (The Building Blocks of ISO/IEC 10646 Migration, Hong Kong Glyph Specification and Assisting Tools)

認識 ISO/IEC 10646

ISO/IEC 10646是一個由國際標準化組織ISO頒布的國際編碼標準,全稱為:《信息技術 - 通用多八位編碼字符集》。該標準包括世界各地的字符及附加符號,大部分被廣泛應用於表示、傳輸、交換、處理、儲存、輸入及顯現等多個方面,以提供一個共通的技術基礎處理不同文字的電子資料。

香港為何需要轉用ISO/IEC 10646平台?

目前,主要的中文編碼標準可分為台灣及香港通用的大五碼(Big5)、中國內地通用的國家標準碼(GB-2312)、及各地均有使用的統一碼(UNICODE - 亦是ISO/IEC 10646的實現碼)。由於中文是大部分香港人的母語,而繁體及簡體中文字亦是ISO/IEC 10646標準所涵蓋的主要字符之一,因此有必要推廣使用ISO/IEC 10646標準作為共通的中文電子通訊界面,解決不同編碼標準所產生的互不兼容問題。同時,亦使香港公眾及業界與世界各地進行的電子交易和通訊,更加準確無誤。

提倡應用香港電腦漢字字形

在香港通行的中文電腦字型,大部分由中國內地或台灣造字商製作,因此未能完全考慮香港的書寫習慣。雖然電腦在教學和印刷上的應用日趨普遍,電腦所提供的字形與香港書寫方式仍有明顯差別,對於教師教導學生學習中文字有一定的困擾。例如,在教科書應印刷的“”字,卻在電腦上顯示並打印為“”。

為了支持出版業和幫助造字商製作符合香港書寫習慣的字形,香港特區政府制訂了兩套《香港電腦漢字字形參考指引》。一套參考指引主要是反映手寫體字形的,稱為《香港電腦漢字楷體字形參考指引》, 另一套主要是反映印刷體字形的,稱為《香港電腦漢字印刷體(宋體)字形參考指引》。

《香港電腦漢字字形參考指引》涵蓋了ISO/IEC 10646-1:2000內的所有繁體字,特別是香港字。因為表意文字是由組成的,因此《指引》採用描述部件的方法來描述字型。也就是說,如果〈木〉字出現在〈樹〉字的左邊,形狀為〈〉,那麼所有左邊有〈木〉字的字,其左邊均應該為〈〉,如:〈村,林,杖,枝〉等。

ISO/IEC 10646漢字與部件的查詢系統

根據香港字形參考指引提供的方法,所有在ISO/IEC 10646-1:2000的中文字都可用部件進行拆分。本項目在分拆ISO/IEC 10646-1:2000的部件基礎上,開發了一套輔助查找ISO/IEC 10646-1:2000漢字和部件的系統,能夠實現從部件到字符及從字符到所組成部件的雙向中文查詢。為配合不同的中文電腦平台使用者,此系統可選擇以大五碼、國家標準碼、或統一碼瀏覽。

從部件到字符的例子:



從字符到所組成部件的例子:




應用ISO/IEC 10646的相關業界

我們希望能透過本項目,提升相關業界對ISO/IEC 10646平台的認識和對有關工具及技術的廣泛應用,相關業界包括:中文造字商、媒體、出版印刷商、中文軟件開發商、設計以及研究中文及信息技術的大學和研究機構等。