統一漢字字符集的歷史

信息交換用中文字符編碼(CCCII)1980年源於台灣,其中包含中國、台灣及日本使用的字符。經過些許修改,被美國採納作為ANSI Z39.64-1989,同時也被作為東亞字符編碼(EACC)用於書籍目錄方面。1981年,日本國會圖書館的Takahashi Tokutaro提議將東亞各國普遍使用的字符集標準化。

利用「統一碼」的統一漢字字符集項目開始於1986年,當時在施樂(Xerox)建立了一個漢字字符對照數據庫。在1988年,蘋果公司(Apple)亦開始了一個與之並行的工作,在圖書館研究組織的中日韓漢字辭典基礎上,維持EACC的發展。直到1989年,蘋果與施樂為了數據庫的合併,做了統一漢字字符集的第一份草案。同年9月,「統一碼」工作組提議將此字符集加入ISO 10646。

統一漢字字符集擴展了已有的書目字符集,使之完全涵蓋工業標準和新的國家標準。最初的統一漢字字符集中所使用的認同標準,是基於一項日本工業標準中的規則,和一套由中國通用中文編碼協會(ACCC)專家們製定的漢字認同規則。

1989年10月的北京會議是Unicode工作組與ACCC的非正式合作的開始,就每個組織對於漢字統一的提議交換了信息。有關漢字統一的第二次特別會議於1990年2月在漢城舉行。在這次會上,韓國代表團建議成立一個組織,集合東亞國家和相關組織共同研究一個漢字統一編碼。這次非正式會議以後,形成了一個中、日、韓聯合研究小組(CJK-JRG)。之後,在1990年十二月草擬了統一漢字字符集。與第一稿不同的是,它使用康熙字典中文字的部首筆劃為序的排序原則。

其間,中國宣佈即將完成漢字字符集GB13000的提案。由於兩個草案從內容到體系結構都很相似,「統一碼」聯盟和原中國機械電子工業部的計算機信息發展中心(CCID,中國計算機標準組織)同意將之合併為一個提案。作為「統一碼」標準與ISO 10646合併的結果,「統一碼」聯盟同意採納由CJK-JRG發展的統一漢字字符集。

第一次CJK-JRG會議於1991年七月在東京召開,會上認同需要將已有的中日韓漢字統一成為一致的編碼標準。制定了兩項基本決議,包括用GB13000作為統一字表和排序的基礎,以及依據規則檢查認同的結果。

1992年3月27日,CJK-JRG完成統一字表和排序(URO)的2.0版。這個字表隨後分別被「統一碼」聯盟發佈為「統一碼」標準1.0版,被ISO發佈為ISO/IEC 10646-1:1993。

1993年10月,CJK-JRG成為ISO/IEC JTC1/SC2/WG2之下的正式組織,同時更名為"表意文字工作小組(IRG)。「統一碼」聯盟作為ISO的聯絡員亦加入了這個組織。 第二次會議於1994年2月在河內舉行,IRG同意將越南漢字加入到未來版本的 URO中,並且增加第五個用於排序的參考字典。

1998年,IRG完成了第一個輔助字集擴充區A (CJK Unified Ideographs Extension A)。這個字集中的6,582個字符是從國家標準、工業標準及歷史文獻中甄選出來的,並已經在「統一碼」標準3.0版中做了編碼。之後,它也被ISO發佈為ISO/IEC 10646-1:2000。現在,IRG正在考慮將中國內地、台灣、香港特別行政區、日本、韓國、新加坡、和越南等地方提交的漢字加入將來擴展的表意字符字表中。