如何轉換Big5-HKSCS編碼文件?

BIG5-HKSCS文件 與 Unicode 文件

作為非 ASCII 字符,每個漢字必須用多位元組代碼編碼。在各種各樣編碼的方案之中,大五碼是繁體中文世界最普遍使用的方案。例如,"香港深水"的Big5編碼為"ADBB B4E4 B260 A4F4" 。

有些僅在香港特別行政區 ( HKSAR ) 使用的漢字字符,例如人名、地方名、及粵方言用字的字符,它們沒有被包括在大五碼方案中。在《香港增補字符集 - 2001》內集合的 4818 個字符,包含了不在大五碼集合中但通常在香港使用的漢字字符和各類符號。作為大五碼的擴充,其代碼為大五碼方案的擴充碼。例如,字符 "香港深水”的編碼為 "ADBB B4E4 B260 A4F4 96F5" 與最後 2 個位元組作為大五碼的擴充碼"96F5",代表香港增補字符集中的 “”字。

上述文件,由於包含了大五碼及HKSCS的大五碼擴充碼,故稱為Big5-HKSCS 編碼文件。因為這些文件是依賴編碼方案系統的,所以不能被中國內地的GB系統讀取。有一種為每個漢字字符提供一個唯一編碼位的編碼系統,適用於任何系統平台和語言,稱為 Unicode 。 Windows2000 便是基於Unicode的多語言支持系統 。

例如,不論所使用是繁體中文或簡體中文的系統語言,字符“香港深水”的 Unicode3.0 編碼都為"9999 6E2F 6DF1 6C34 57D7"。Unicode 編碼方案因為它的編碼獨立於系統,正在變得越來越流行起來。

轉換Big5-HKSCS編碼文件

由香港理工大學開發的BIG5-HKSCS 編碼文件轉換系統 ( BFCS ),是將BIG5-HKSCS 編碼文件轉換成Unicode 編碼文件。它不但可以轉換基本的文本文件,還可以轉換 Microsoft Office 應用程式文件。它有一個綜合易用的用戶介面。

系統的特徵如下:
  • 它不但可以轉換基本的文件 ( 文本文件、HTML 文件與RTF格式文件 ) ,還可以轉換 Microsoft Office 應用程式文件 ( Microsoft Word、Microsoft Excel 與 Microsoft PowerPoint )。轉換可以是整個文件夾的批轉換,亦可以是單一文件的轉換。

  • 圖形化的用戶友好介面。

  • 轉換的設置,例如輸入和輸出文件名稱,轉換文件類型等,可以保存於單獨的設置文件中,為下一次的轉換工作引用。

  • 日誌文件將提供用戶每轉換批的結果,方便用戶檢查連接文件是否正確。

  • BFCS安裝精靈使用戶簡易快捷地安裝 BFCS 系統。

我們在此提供了一個BFCS的網上演示版