字符子集分佈(基本多文種平面)

在ISO/IEC 10646-1:2000編碼標準 (Unicode 3.0版本)中,基本多文種平面的編碼空間分成幾個區域,每個區域下再分成若干的字符區:

基本拼音字符區 (0000-1FFF)
包括所有拼讀文字的字母拼音和音標。它的字符集一般較小,如::拉丁文、西里爾文、希臘文、希伯來文、阿拉伯文、泰文、天成文書(梵文)等。

符號區 (2000-28FF)
包括許多種用於標點、數學、化學、科技及其它特殊用途上的「符號」和「丁貝符」(示意圖形符號)。

中日韓語音及符號區 (2E80-33FF)

包括用於中國、日本、韓國語言中的標點、符號、字根(筆畫)及發音等字符。

中日韓漢字字符區 (3400-9FA5)
由27,484個中日韓(越)的統一漢字組成。

彝族字符區 (A000-A4C6)
由1,165個中國南方彝族音節和50個其字根組成。

韓字符拼音區 (AC00-D7A3)
由11,172個預先組合的韓字符拼音音節組成。

代理區 (D800-DFFF)
這個區被平分為1024個「高半代理區」(D800-DBFF) 碼位和1024個「低半代理區」(DC00-DFFF)碼位,用來形成代理對,可以得到超過一百 萬個擴充編碼位。

私人專用區 (E000-F8FF)
包含6,400個編碼位,用於用戶或開發商自行定義的字符編碼。

兼容字符區 (F900-FA2D)
包括一些被許多行業協會和國家標準廣泛使用的字符,但在「統一碼」編碼中有不同的表現形式。包含一些專用字符。