Unicode字符平面映射

目前的統一碼字元分為17組編排,每組稱為平面(Plane),每平面有65536(216)點代碼,但目前只用了少數平面。

平面範圍中文名英文名
0號 0000FFFF 基本多文種平面 Basic Multilingual Plane,簡稱BMP
1號 100001FFFF 多文種補充平面 Supplementary Multilingual Plane,簡稱SMP
2號 200002FFFF 表意文字補充平面 Supplementary Ideographic Plane,簡稱SIP
3號 300003FFFF 表意文字第三平面 Tertiary Ideographic Plane,簡稱TIP
4號

13號
40000DFFFF (未啓用)
14號 E0000EFFFF 特別用途補充平面 Supplementary Special-purpose Plane,簡稱SSP
15號 F0000FFFFF 保留作為私人使用區(A區)[1] Private Use Area-A,簡稱PUA-A
16號 10000010FFFF 保留作為私人使用區(B區)[1] Private Use Area-B,簡稱PUA-B

詳細描述請參閱基本多文種平面辅助平面

基本多文种平面

基本多文種平面示意圖,有十六進數的格子代表256點代碼點。

基本多文种平面(Basic Multilingual Plane, BMP),或称基本平面〇號平面(Plane 0),是統一碼的一区段编码,从0000FFFF

第十五點〇版已分配编码区段为:

范围中文名英语名
0000007F基本拉丁文Basic Latin
008000FF拉丁字母补充-1Latin-1 Supplement
0100017F拉丁字母扩展-ALatin Extended-A
0180024F拉丁字母扩展-BLatin Extended-B
025002AF国际音标扩展IPA Extensions
02B002FF占位修饰符号Spacing Modifier Letters
0300036F结合附加符号Combining Diacritics Marks
037003FF希腊字母科普特字母Greek and Coptic
040004FF西里尔字母Cyrillic
0500052F西里尔字母补充Cyrillic Supplement
0530058F亚美尼亚字母Armenian
059005FF希伯来文Hebrew
060006FF阿拉伯文Arabic
0700074F叙利亚文Syriac
0750077F阿拉伯字母补充Arabic Supplement
078007BF它拿字母Thaana
07C007FF西非書面文字N'Ko
0800083F撒玛利亚字母Samaritan
0840085F曼达文字Mandaic
0860086F叙利亚文补充Syriac Supplement
0870089F阿拉伯文扩展-BArabic Extended-B
08A008FF阿拉伯文扩展-AArabic Extended-A
0900097F天城文Devanagari
098009FF孟加拉文Bengali
0A000A7F古木基文Gurmukhi
0A800AFF古吉拉特文Gujarati
0B000B7F奥里亚文Oriya
0B800BFF泰米尔文Tamil
0C000C7F泰卢固文Telugu
0C800CFF卡纳达文Kannada
0D000D7F马拉雅拉姆文Malayalam
0D800DFF僧伽罗文Sinhala
0E000E7F泰文Thai
0E800EFF老挝文Lao
0F000FFF藏文Tibetan
1000109F缅甸文Myanmar
10A010FF格鲁吉亚字母Georgian
110011FF諺文字母Hangul Jamo
1200137F吉兹字母Ethiopic
1380139F吉兹字母补充Ethiopic Supplement
13A013FF切罗基字母Cherokee
1400167F统一加拿大原住民音節文字Unified Canadian Aboriginal Syllabics
1680169F欧甘字母Ogham
16A016FF卢恩字母Runic
1700171F他加禄字母Tagalog
1720173F哈努诺文Hanunóo
1740175F布希德文Buhid
1760177F塔格班瓦文Tagbanwa
178017FF高棉文Khmer
180018AF蒙古文Mongolian
18B018FF加拿大原住民音節文字扩展Unified Canadian Aboriginal Syllabics Extended
1900194F林布文Limbu
1950197F德宏傣文Tai Le
198019DF新傣仂文New Tai Lue
19E019FF高棉文符号Khmer Symbols
1A001A1F布吉文Buginese
1A201AAF老傣文Tai Tham
1AB01AFF组合变音标记扩展Combining Diacritical Marks Extended
1B001B7F巴厘字母Balinese
1B801BBF巽他字母Sundanese
1BC01BFF巴塔克文Batak
1C001C4F雷布查字母Lepcha
1C501C7F桑塔利文Ol Chiki
1C801C8F西里尔字母扩充-CCyrillic Extended-C
1C901CBF格鲁吉亚字母扩展Georgian Extended
1CC01CCF巽他字母补充Sudanese Supplement
1CD01CFF梵文吠陀扩展Vedic Extensions
1D001D7F音标扩展Phonetic Extensions
1D801DBF音标扩展补充Phonetic Extensions Supplement
1DC01DFF结合附加符号补充Combining Diacritics Marks Supplement
1E001EFF拉丁文扩展附加Latin Extended Additional
1F001FFF希腊文扩展Greek Extended
2000206F常用标点General Punctuation
2070209F上标下标Superscripts and Subscripts
20A020CF货币符号Currency Symbols
20D020FF符号用组合附加符号Combining Diacritical Marks for Symbols
2100214F字母式符号Letterlike Symbols
2150218F数字形式Number Forms
219021FF箭头Arrows
220022FF数学运算符Mathematical Operators
230023FF雜項技術符號Miscellaneous Technical
2400243F控制图片Control Pictures
2440245F光学识别符Optical Character Recognition
246024FF带圈字母和数字Enclosed Alphanumerics
2500257F制表符Box Drawing
2580259F方块元素Block Elements
25A025FF几何图形Geometric Shapes
260026FF雜項符號Miscellaneous Symbols
270027BF装饰符号Dingbats
27C027EF杂项数学符号-AMiscellaneous Mathematical Symbols-A
27F027FF追加箭头-ASupplemental Arrows-A
280028FF盲文点字模型Braille Patterns
2900297F追加箭头-BSupplemental Arrows-B
298029FF杂项数学符号-BMiscellaneous Mathematical Symbols-B
2A002AFF追加数学运算符Supplemental Mathematical Operator
2B002BFF雜項符號和箭頭Miscellaneous Symbols and Arrows
2C002C5F格拉哥里字母Glagolitic
2C602C7F拉丁文扩展-CLatin Extended-C
2C802CFF科普特字母Coptic
2D002D2F格鲁吉亚字母补充Georgian Supplement
2D302D7F提非纳文Tifinagh
2D802DDF吉兹字母扩展Ethiopic Extended
2DE02DFF西里尔字母扩展-ACyrillic Extended-A
2E002E7F追加标点Supplemental Punctuation
2E802EFF中日韩汉字部首补充CJK Radicals Supplement
2F002FDF康熙部首Kangxi Radicals
2FF02FFF表意文字序列Ideographic Description Characters
3000303F中日韩符号和标点CJK Symbols and Punctuation
3040309F日文平假名Hiragana
30A030FF日文片假名Katakana
3100312F注音符号Bopomofo
3130318F谚文兼容字母Hangul Compatibility Jamo
3190319F汉文注释标志Kanbun
31A031BF注音字母扩展Bopomofo Extended
31C031EF中日韩笔画CJK Strokes
31F031FF日文片假名拼音扩展Katakana Phonetic Extensions
320032FF带圈的CJK字符及月份Enclosed CJK Letters and Months
330033FF中日韩兼容字符CJK Compatibility
34004DBF中日韓統一表意文字擴展區ACJK Unified Ideographs Extension A
4DC04DFF易经六十四卦符号Yijing Hexagrams Symbols
4E009FFF中日韩统一表意文字CJK Unified Ideographs
A000A48F彝文音节Yi Syllables
A490A4CF彝文字根Yi Radicals
A4D0A4FF老傈僳文Lisu
A500A63F瓦伊语Vai
A640A69F西里尔字母扩展-BCyrillic Extended-B
A6A0A6FF巴姆穆文字Bamum
A700A71F声调修饰符号Modifier Tone Letters
A720A7FF拉丁文扩展-DLatin Extended-D
A800A82F锡尔赫特文Syloti Nagri
A830A83F通用印度数字格式Common Indic Number Forms
A840A87F八思巴字Phags-pa
A880A8DF索拉什特拉文Saurashtra
A8E0A8FF天城文扩展Devanagari Extended
A900A92F克耶里字母Kayah Li
A930A95F勒姜字母Rejang
A960A97F谚文扩展-AHangul Jamo Extended-A
A980A9DF爪哇字母Javanese
A9E0A9FF缅甸文扩展-BMyanmar Extended-B
AA00AA5F占语字母Cham
AA60AA7F缅甸文扩展-AMyanmar Extended-A
AA80AADF越南傣文Tai Viet
AAE0AAFF曼尼普尔文扩展Meetei Mayek Extensions
AB00AB2F吉兹字母扩展-AEthiopic Extended-A
AB30AB6F拉丁文扩展-ELatin Extended-E
AB70ABBF切罗基语补充Cherokee Supplement
ABC0ABFF曼尼普尔文Meetei Mayek
AC00D7AF谚文音节Hangul Syllables
D7B0D7FF谚文字母扩展-BHangul Jamo Extended-B
D800DBFFUTF-16的高半区High-half zone of UTF-16
DC00DFFFUTF-16的低半区Low-half zone of UTF-16
E000F8FF私用区Private Use Area
F900FAFF中日韩兼容表意文字CJK Compatibility Ideographs
FB00FB4F字母表達形式(拉丁字母连字亚美尼亚字母连字、希伯来文表现形式)Alphabetic Presentation Forms
FB50FDFF[2]阿拉伯字母表達形式-AArabic Presentation Forms A
FE00FE0F異體字选择器Variation Selector
FE10FE1F竖排形式Vertical Forms
FE20FE2F组合用半符号Combining Half Marks
FE30FE4F中日韩兼容形式CJK Compatibility Forms
FE50FE6F小寫变体形式Small Form Variants
FE70FEFF阿拉伯文表達形式-BArabic Presentation Forms B
FF00FFEF半形全形字符Halfwidth and Fullwidth Forms
FFF0FFFF特殊字元區Specials

以下為第〇平面的編碼表:

統一碼第〇平面
00000FFF · 1000-1FFF · 2000-2FFF · 3000-3FFF
4000-4FFF ·
5000-5FFF · 6000-6FFF · 7000-7FFF
8000-8FFF ·
9000-9FFF · A000-AFFF · B000-BFFF
C000-CFFF ·
D000-DFFF · E000-EFFF · F000-FFFF
基本平面 · 第一輔助平面 · 第二輔助平面 · 第三輔助平面 · · 第十四輔助平面 · 第十五輔助平面 · 第十六輔助平面


第一輔助平面

多文種補充平面的示意圖,有十六進數的格子代表256點代碼點。

第一輔助平面又稱多文種補充平面Supplementary Multilingual Plane,縮寫SMP,或簡稱Plane 1),主要擺放絕大多數古代文字,現時已不再使用或很少使用文字、速記、数学字母符号、音符、圖形符號及用于学者的专业论文中使用的古老或过时的语言书写符号,以及网络通信等使用的繪文字

第一輔助平面範圍在100001FFFF,计划分配如下。

范围中文名英语名
100001007F线形文字B音节文字Linear B Syllabary
10080100FF线形文字B表意文字Linear B Ideograms
101001013F爱琴海数字Aegean Numbers
101401018F古希腊数字Ancient Greek Numbers
10190101CF古代记数系统Ancient Symbols
101D0101FF费斯托斯圆盘Phaistos Disc
102801029F吕基亚字母Lycian
102A0102DF卡利亚字母Carian
102E0102FF科普特闰余数字Coptic Epact Numbers
103001032F古意大利字母Old Italic
103301034F哥特字母Gothic
103501037F古彼尔姆文Old Permic
103801039F乌加里特字母Ugaritic
103A0103DF古波斯楔形文字Old Persian
104001044F德赛莱特字母Deseret
104501047F萧伯纳字母Shavian
10480104AF奥斯曼亚字母Osmanya
104B0104FF欧塞奇字母Osage
105001052F艾尔巴桑字母Elbasan
105301056F高加索阿尔巴尼亚文Caucasian Albanian
10570105BF維斯庫奇文Vithkuqi
106001077F线形文字ALinear A
10780107BF拉丁文扩展-FLatin Extended-F
108001083F塞浦路斯音节文字Cypriot Syllabary
108401085F帝国亚兰文字Imperial Aramaic
108601087F帕尔迈拉字母Palmyrene
10880108AF纳巴泰字母Nabataean
108E0108FF哈特兰文Hatran
109001091F腓尼基字母Phoenician
109201093F吕底亚字母Lydian
109801099F麦罗埃文圣书体Meroitic Hieroglyphs
109A0109FF麦罗埃文草书体Meroitic Cursive
10A0010A5F佉卢文Kharoshthi
10A6010A7F古南阿拉伯字母Old South Arabian
10A8010A9F古北阿拉伯字母Old North Arabian
10AC010AFF摩尼字母Manichaean
10B0010B3F阿维斯陀字母Avestan
10B4010B5F碑刻帕提亚文Inscriptional Parthian
10B6010B7F碑刻巴列维文Inscriptional Pahlavi
10B8010BAF诗篇巴列维文Psalter Pahlavi
10C0010C4F古突厥文Old Turkic
10D0010D3F哈乃斐罗兴亚文字Hanifi Rohingya
10C8010CFF古匈牙利字母Old Hungarian
10E6010E7F卢米文数字Rumi Numeral Symbols
10E8010EBF雅茲迪文Yezidi
10EC010EFF阿拉伯文扩展-CArabic Extended-C
10F0010F2F古粟特字母Old Sogdian
10F3010F6F粟特字母Sogdian
10F7010FAF回鶻字母Old Uyghur
10FB010FDF花剌子模字母Chorasmian
10FE010FFF埃利迈斯字母Elymaic
110001107F婆罗米文字Brahmi
11080110CF凯提文Kaithi
110D0110FF索拉僧平文字Sora Sompeng
111001114F查克马文Chakma
111501117F马哈佳尼文Mahajani
11180111DF夏拉达文Sharada
111E0111FF古僧伽罗文数字Sinhala Archaic Numbers
112001124F可吉文Khojki
11280112AF穆尔塔尼文Multani
112B0112FF库达瓦迪文Khudawadi
113001137F古兰塔文Grantha
114001147F尼泊尔纽瓦字母Newa
11480114DF底罗仆多文Tirhuta
11580115FF悉昙文字Siddham
116001165F莫迪文Modi
116601167F蒙古文补充Mongolian Supplement
11680116CF塔克里字母Takri
117001174F阿洪姆文Ahom
118001184F多格拉文Dogra
118A0118FF瓦兰齐地文Warang Citi
119001195F岛屿字母Dhives Akuru
119A0119FF南迪那嘎黎文Nandinagari
11A0011A4F札那巴札尔方形字母Zanabazar Square
11A5011AAF索永布文字Soyombo
11AB011ABF加拿大原住民音節文字扩展AUnified Canadian Aboriginal Syllabics Extended-A
11AC011AFF包钦豪文Pau Cin Hau
11B0011B5F天城文扩展ADevanagari Extended-A
11C0011C6F拜克舒基文Bhaiksuki
11C7011CBF玛钦文Marchen
11D0011D5F马萨拉姆共地文字Masaram Gondi
11D6011DAF古吉拉共地文字Gunjala Gondi
11EE011EFF望加锡Makasar
11F0011F5F卡維文Kawi
11FB011FBF老傈僳文Lisu Supplement
11FC011FFF泰米尔文补充Tamil Supplement
12000123FF楔形文字Cuneiform
124001247F楔形文字数字和标点符号Cuneiform Numbers and Punctuation
124801254F早期王朝楔形文字Early Dynastic Cuneiform
12F9012FFF塞普勒斯-米諾斯文字 Cypro-Minoan
130001342F埃及圣书体Egyptian Hieroglyphs
134301345F埃及圣书体格式控制Egyptian Hieroglyphs Format Controls
144001467F安納托利亞象形文字Anatolian Hieroglyphs
1680016A3F巴姆穆文字补充Bamum Supplement
16A4016A6F默文Mro
16A7016ACF唐薩文Tangsa
16AD016AFF巴萨哇文字Bassa Vah
16B0016B8F救世苗文Pahawh Hmong
16E4016E9F梅德法伊德林文Medefaidrin
16F0016F9F柏格理苗文Miao
16FE016FFF表意符号标点符号Ideographic Symbols and Punctuation
17000187FF西夏文Tangut
1880018AFF西夏文部首Tangut Components
18B0018CFF契丹小字Khitan Small Script
18D0018D8F西夏文补充Tangut Supplement
1AFF01AFFF日文假名扩展-BKana Extended-B
1B0001B0FF日文假名补充Kana Supplement
1B1001B12F日文假名扩展-AKana Extended-A
1B1301B16F小假名扩充Small Kana Extension
1B1701B2FF女书Nushu
1BC001BC9F杜普雷速记Duployan
1BCA01BCAF速记格式控制符Shorthand Format Controls
1CF001CFFF贊玫尼聖歌音樂符號Znamenny Musical Notation
1D0001D0FF拜占庭音乐符号Byzantine Musical Symbols
1D1001D1FF音乐符号Musical Symbols
1D2001D24F古希腊音乐记号Ancient Greek Musical Notation
1D2C01D2DF因努伊特數字Kaktovik Numerals
1D2E01D2FF玛雅数字Mayan Numerals
1D3001D35F太玄经符号Tai Xuan Jing Symbols
1D3601D37F算筹Counting Rod Numerals
1D4001D7FF数学字母数字符号Mathematical Alphanumeric Symbols
1D8001DAAF萨顿书写符号Sutton SignWriting
1DF001DFFF拉丁文扩展-GLatin Extended-G
1E0001E02F格拉哥里字母补充Glagolitic Supplement
1E0301E08F西里尔字母扩展-DCyrillic Extended-D
1E1001E14F创世纪苗文Nyiakeng Puachue Hmong
1E2901E2BF托托文Toto
1E2C01E2FF文喬文Wancho
1E4D01E4FF蒙達里字母Nag Mundari
1E7E01E7FF吉兹字母扩展-BEthiopic Extended-B
1E8001E8DF门地奇卡奎文Mende Kikakui
1E9001E95F阿德拉姆字母Adlam
1EC701ECBF印度西亚克数字Indic Siyaq Numbers
1ED001ED4F奥斯曼西亚克数字Ottoman Siyaq Numbers
1EE001EEFF阿拉伯字母数字符号Arabic Mathematical Alphanumeric Symbols
1F0001F02F麻将牌Mahjong Tiles
1F0301F09F多米诺骨牌Domino Tiles
1F0A01F0FF扑克牌Playing Cards
1F1001F1FF带圈字母数字补充Enclosed Alphanumeric Supplement
1F2001F2FF带圈表意文字补充Enclosed Ideographic Supplement
1F3001F5FF杂项符号象形文字Miscellaneous Symbols And Pictographs
1F6001F64F表情符号Emotions
1F6501F67F装饰符号Ornamental Dingbats
1F6801F6FF交通和地图符号Transport And Map Symbols
1F7001F77F炼金术符号Alchemical Symbols
1F7801F7FF几何图形扩展Geometric Shapes Extended
1F8001F8FF追加箭头-CSupplemental Arrows-C
1F9001F9FF補充符號和象形文字Supplemental Symbols and Pictographs
1FA001FA6F西洋棋符号Chess Symbols
1FA701FAFF符号和象形文字扩展-ASymbols and Pictographs Extended-A
1FB001FBFF保留计算符号Symbols for Legacy Computing

以下為第一輔助平面的編碼表:

統一碼第一輔助平面
1000010FFF · 11000-11FFF · 12000-12FFF · 13000-13FFF
14000-14FFF ·
15000-15FFF · 16000-16FFF · 17000-17FFF
18000-18FFF ·
19000-19FFF · 1A000-1AFFF · 1B000-1BFFF
1C000-1CFFF ·
1D000-1DFFF · 1E000-1EFFF · 1F000-1FFFF
第〇平面 · 第一輔助平面 · 第二輔助平面 · 第三輔助平面 · · 第十四輔助平面 · 第十五輔助平面 · 第十六輔助平面

第二輔助平面

表意文字補充平面示意圖,有十六進數的格子代表256點代碼點。

第二輔助平面又稱表意文字補充平面Supplementary Ideographic Plane,縮寫SIP,或簡稱Plane 2),在200002FFFF,配置的都是罕用汉字或地區方言用字,如字及越南語字喃。現時擺放了「中日韓統一表意文字擴展B區」(4萬2720汉字)、「中日韓統一表意文字擴展C區」(4154汉字)、「中日韓統一表意文字擴展D區」(222汉字)、「中日韓統一表意文字擴展E區」(5762汉字)、「中日韓統一表意文字擴展F區」(7473汉字)、「中日韓統一表意文字擴展I區」(622汉字)以及中日韓兼容表意文字增補(CJK Compatibility Ideographs Supplement)。

已分配的編碼區段為:

以下為第二輔助平面的編碼表:

統一碼第二輔助平面
2000020FFF · 21000-21FFF · 22000-22FFF · 23000-23FFF
24000-24FFF ·
25000-25FFF · 26000-26FFF · 27000-27FFF
28000-28FFF ·
29000-29FFF · 2A000-2AFFF · 2B000-2BFFF
2C000-2CFFF ·
2D000-2DFFF · 2E000-2EFFF · 2F000-2FFFF
第〇平面 · 第一輔助平面 · 第二輔助平面 · 第三輔助平面 · · 第十四輔助平面 · 第十五輔助平面 · 第十六輔助平面

第三輔助平面

表意文字第三平面示意圖,有十六進數的格子代表256點代碼點。

第三輔助平面已有编码提案。本平面現已用來擺放汉字扩展区G和H,並規劃用於擺放甲骨文金文小篆中國戰國時期文字等,範圍在300003FFFF

已分配的編碼區段為:

按統一碼官网的路线图,計劃分配的編碼區段為:

  • 380003AB9F:篆书(提案已提交)。[3]

以下為第三輔助平面的編碼表:

統一碼第三輔助平面
3000030FFF · 31000-31FFF · 32000-32FFF · 33000-33FFF
34000-34FFF ·
35000-35FFF · 36000-36FFF · 37000-37FFF
38000-38FFF ·
39000-39FFF · 3A000-3AFFF · 3B000-3BFFF
3C000-3CFFF ·
3D000-3DFFF · 3E000-3EFFF · 3F000-3FFFF
第〇平面 · 第一輔助平面 · 第二輔助平面 · 第三輔助平面 · · 第十四輔助平面 · 第十五輔助平面 · 第十六輔助平面

第四至十三輔助平面

第四至第十三輔助平面尚无使用计划。

第十四輔助平面

特別用途補充平面示意圖,有十六進數的格子代表256點代碼點。

第十四輔助平面又稱特別用途補充平面Supplementary Special-purpose Plane,簡稱SSP),目前僅擺放「語言編碼標籤」和「字形變換選取器」,它們都是控制字符。範圍在E0000E01FF

  • 标签E0000E007F
  • 选择器变化补充(E0100E01EF

以下為第十四輔助平面的編碼表:

統一碼第十四輔助平面
E0000E0FFF · E1000-E1FFF · E2000-E2FFF · E3000-E3FFF
E4000-E4FFF ·
E5000-E5FFF · E6000-E6FFF · E7000-E7FFF
E8000-E8FFF ·
E9000-E9FFF · EA000-EAFFF · EB000-EBFFF
EC000-ECFFF ·
ED000-EDFFF · EE000-EEFFF · EF000-EFFFF
第〇平面 · 第一輔助平面 · 第二輔助平面 · 第三輔助平面 · · 第十四輔助平面 · 第十五輔助平面 · 第十六輔助平面

第十五至十六輔助平面

第十五至十六輔助平面都是私人使用區,範圍在F0000FFFFD10000010FFFD

第〇平面 · 第一輔助平面 · 第二輔助平面 · 第三輔助平面 · · 第十四輔助平面 · 第十五輔助平面 · 第十六輔助平面

參見

注记

  1. 最初的「私人使用區」(Private Use Area,簡稱PUA)位於U+E000至U+F8FF
  2. 其中FDD0-FDEF段为“非字符”(Noncharacter)。
  3. . 統一碼聯盟. [2018-06-03]. (原始内容存档于2018-06-11).

外部链接

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.