組合字符

組合字符()在字體排印學中是用來改變其它字符所用的字符。在拉丁字母中,最常見的組合字符為附加符號(包含重音號)。 [1]

西里爾字母У短音符組合成Ў.

統一碼也包含許多預組字符(Precomposed character),即事先將字符組好並賦予碼位。所以有可能同時使用組合字符和預組字符。這導致了若要比較兩個統一碼字串或設計編碼轉換器時,需要先執行Unicode正規化[2]

在統一碼中,用於歐洲語言和國際音標的組合用附加符號為〈U+0300–U+036F〉。組合用附加符號亦存在統一碼中的多個區塊。在統一碼中,附加符號總是加在主要字符之後。因此,有可能加入多個附加符號。直到2006年,只有少數軟體能正確顯示此類組合。

OpenType

OpenType則有ccmp功能標籤,以定義字形是由其它組合字符所組合出來或可分解之,另有mark標籤用以將組合字符疊加於基本字符,以及mkmk標籤用以組合字符彼此之間的組合。

統一碼範圍

  • 組合附加符號(Combining Diacritical Marks,0300–036F),由版本1.0始,陸續修改到4.1。[3][4]
  • 組合附加符號擴展(Combining Diacritical Marks Extended,1AB0–1AFF),由版本7.0開始加入。[5]
  • 組合附加符號补充(Combining Diacritical Marks Supplement,1DC0–1DFF),由版本4.1開始,陸續修改到5.2。[5]
  • 符號用組合附加符號(Combining Diacritical Marks for Symbols,20D0–20FF),由版本1.0開始,陸續修改到5.1。[5]
  • 組合半符號(Combining Half Marks,FE20–FE2F),由版本1.0開始,陸續修改到8.0。[5]
組合附加符號
Combining Diacritical Marks
[1]
Unicode Consortium 官方碼表(PDF)
 0123456789ABCDEF
U+030x ̀ ́ ̂ ̃ ̄ ̅ ̆ ̇ ̈ ̉ ̊ ̋ ̌ ̍ ̎ ̏
U+031x ̐ ̑ ̒ ̓ ̔ ̕ ̖ ̗ ̘ ̙ ̚ ̛ ̜ ̝ ̞ ̟
U+032x ̠ ̡ ̢ ̣ ̤ ̥ ̦ ̧ ̨ ̩ ̪ ̫ ̬ ̭ ̮ ̯
U+033x ̰ ̱ ̲ ̳ ̴ ̵ ̶ ̷ ̸ ̹ ̺ ̻ ̼ ̽ ̾ ̿
U+034x ̀ ́ ͂ ̓ ̈́ ͅ ͆ ͇ ͈ ͉ ͊ ͋ ͌ ͍ ͎  CGJ 
U+035x ͐ ͑ ͒ ͓ ͔ ͕ ͖ ͗ ͘ ͙ ͚ ͛ ͜ ͝ ͞ ͟
U+036x ͠ ͡ ͢ ͣ ͤ ͥ ͦ ͧ ͨ ͩ ͪ ͫ ͬ ͭ ͮ ͯ
注释
1.^ 依據 Unicode 14.0

碼點U+0346–034A為國際音標符號:

  • U+0346  ͆唇齿化
  • U+0347  ͇齒齦音
  • U+0348  ͈強音
  • U+0349  ͉ :弱音
  • U+034A  ͊去鼻音化

碼點U+034B–034E用於言語障礙國際音標附加符號

  • U+034B  ͋ :鼻腔洩氣
  • U+034C  ͌ :齶咽擦音
  • U+034D  ͍ :唇部伸展
  • U+034E  ͎ :哨音
组合附加符号扩展
Combining Diacritical Marks Extended
[1][2]
Unicode Consortium 官方碼表(PDF)
 0123456789ABCDEF
U+1ABx ᪿ
U+1ACx
U+1ADx
U+1AEx
U+1AFx
注释
1.^ 依据 Unicode 14.0
2.^ 灰色区域为未分配码位
組合附加符號補充
Combining Diacritical Marks Supplement
[1][2]
Unicode Consortium 官方碼表(PDF)
0123456789ABCDEF
U+1DCx
U+1DDx
U+1DEx
U+1DFx ᷿
注释
1.^ 依据 Unicode 14.0
2.^ 灰色区域为未分配码位
符號用組合附加符號
Combining Diacritical Marks for Symbols[1][2]
Unicode Consortium 官方碼表 (PDF)
0123456789ABCDEF
U+20Dx
U+20Ex
U+20Fx
注释
1.^ 依据 Unicode 14.0
2.^ 灰色区域为未分配码位
組合半符號
Combining Half Marks[1]
Unicode Consortium 官方碼表 (PDF)
 0123456789ABCDEF
U+FE2x
注释
1.^ 依据 Unicode 13.0

註釋

  1. Unicode: Combining Half Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  2. 例如,當在做windows-1258和越南資訊交換標準代碼之間的轉換時,前者使用組合字符而後者使用大量預組字符。轉換器若只是單純地與統一碼做轉換,則會導致混亂。
  3. Unicode: Combining Diacritical Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  4. Unicode: Combining Diacritical Marks for Symbols (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  5. Unicode: Combining Diacritical Marks Supplement (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.

參見

外部連結

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.