UCS 的一般結構

它的正則結構是一個四維的編碼空間,ISO/IEC 10646 中每一個八位序列值的範圍為 00到FF。總體上分為128個群組(Group 00-7F),每一群組由 256 個平面(Plane 00-FF)組成,每一平面有256行(Row 00-FF),每一行256個編碼位(Cell 00-FF)。所以,每一平面包括 65,536 個字位(Character Position 0000-FFFF)。

整個編碼字符集的每個字符都由肆個八位序列,按"組-面-行-列"的順序表示。所以該標準的可編碼空間為:128 x 256 x 256 x 256=231

另外,ISO/IEC 10646有兩種方式來表示文字之交換碼,肆個八位元正規形式 (Four-octet canonical form)和雙八位元基本字面形式(Two-octet BMP form)。而ISO/IEC 10646將其第一個平面(00群組中的00平面)稱作基本多文種平面(Basic Multilingual Plane, BMP)。

圖表1:ISO/IEC 10646的整個編碼空間


圖表2:ISO/IEC 10646中的00組