組合字符

本页使用了标题或全文手工转换,现处于不转换模式
求闻百科,共笔求闻
西里尔字母У短音符組合成Ў.

組合字符Combining character)在字体排印学中是用来改變其它字符所用的字符。在拉丁字母中,最常见的組合字符为附加符号(包含重音号)。 [1]

统一碼也包含許多預組字符(Precomposed character),即事先将字符組好并賦予碼位。所以有可能同時使用組合字符和預組字符。這导致了若要比较两个统一碼字串或设计編碼轉換器時,需要先執行Unicode正规化[2]

在统一碼中,用于欧洲语言和国际音标的組合用附加符号为〈U+0300–U+036F〉。組合用附加符号亦存在统一碼中的多个区块。在统一碼中,附加符号总是加在主要字符之后。因此,有可能加入多个附加符号。直到2006年,只有少数軟体能正确顯示此类組合。

OpenType

OpenType則有ccmp功能标籤,以定义字形是由其它組合字符所組合出来或可分解之,另有mark标籤用以将組合字符疊加于基本字符,以及mkmk标籤用以組合字符彼此之间的組合。

统一碼范围

組合附加符號
Combining Diacritical Marks
[1]
Unicode 聯盟官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+030x ◌̀ ◌́ ◌̂ ◌̃ ◌̄ ◌̅ ◌̆ ◌̇ ◌̈ ◌̉ ◌̊ ◌̋ ◌̌ ◌̍ ◌̎ ◌̏
U+031x ◌̐ ◌̑ ◌̒ ◌̓ ◌̔ ◌̕ ◌̖ ◌̗ ◌̘ ◌̙ ◌̚ ◌̛ ◌̜ ◌̝ ◌̞ ◌̟
U+032x ◌̠ ◌̡ ◌̢ ◌̣ ◌̤ ◌̥ ◌̦ ◌̧ ◌̨ ◌̩ ◌̪ ◌̫ ◌̬ ◌̭ ◌̮ ◌̯
U+033x ◌̰ ◌̱ ◌̲ ◌̳ ◌̴ ◌̵ ◌̶ ◌̷ ◌̸ ◌̹ ◌̺ ◌̻ ◌̼ ◌̽ ◌̾ ◌̿
U+034x ◌̀ ◌́ ◌͂ ◌̓ ◌̈́ ◌ͅ ◌͆ ◌͇ ◌͈ ◌͉ ◌͊ ◌͋ ◌͌ ◌͍ ◌͎  CGJ 
U+035x ◌͐ ◌͑ ◌͒ ◌͓ ◌͔ ◌͕ ◌͖ ◌͗ ◌͘ ◌͙ ◌͚ ◌͛ ◌͜◌ ◌͝◌ ◌͞◌ ◌͟◌
U+036x ◌͠◌ ◌͡◌ ◌͢◌ ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ
注释
1.^ 依據 Unicode 13.0

碼点U+0346–034A为国际音标符号:

  • U+0346  ͆唇齿化
  • U+0347  ͇齒齦音
  • U+0348  ͈强音
  • U+0349  ͉ :弱音
  • U+034A  ͊去鼻音化

碼点U+034B–034E用于言语障礙国际音标附加符号

  • U+034B  ͋ :鼻腔洩气
  • U+034C  ͌ :齶咽擦音
  • U+034D  ͍ :唇部伸展
  • U+034E  ͎ :哨音
组合附加符号扩展
Combining Diacritical Marks Extended
[1][2]
Unicode 联盟官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1ABx ◌᪰ ◌᪱ ◌᪲ ◌᪳ ◌᪴ ◌᪵ ◌᪶ ◌᪷ ◌᪸ ◌᪹ ◌᪺ ◌᪻ ◌᪼ ◌᪽ ◌᪾ ◌ᪿ
U+1ACx ◌ᫀ
U+1ADx
U+1AEx
U+1AFx
注释
1.^ 依据 Unicode 13.0
2.^ 灰色区域为未分配码位
組合附加符號補充
Combining Diacritical Marks Supplement
[1][2]
Unicode 联盟官方码表(PDF)
0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1DCx ◌᷀ ◌᷁ ◌᷂ ◌᷃ ◌᷄ ◌᷅ ◌᷆ ◌᷇ ◌᷈ ◌᷉ ◌᷊ ◌᷋ ◌᷌ ◌᷍ ◌᷎ ◌᷏
U+1DDx ◌᷐ ◌᷑ ◌᷒ ◌ᷓ ◌ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷜ ◌ᷝ ◌ᷞ ◌ᷟ
U+1DEx ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷥ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷩ ◌ᷪ ◌ᷫ ◌ᷬ ◌ᷭ ◌ᷮ ◌ᷯ
U+1DFx ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ ◌᷵ ◌᷶ ◌᷷ ◌᷸ ◌᷹ ◌᷻ ◌᷼ ◌᷽ ◌᷾ ◌᷿
注释
1.^ 依据 Unicode 13.0
2.^ 灰色区域为未分配码位
符號用組合附加符號
Combining Diacritical Marks for Symbols
[1][2]
Unicode 联盟官方代码表(PDF)
0 1 2 3 4 5 6 7 8 9 A B C D E F
U+20Dx ◌⃐ ◌⃑ ◌⃒ ◌⃓ ◌⃔ ◌⃕ ◌⃖ ◌⃗ ◌⃘ ◌⃙ ◌⃚ ◌⃛ ◌⃜ ◌⃝ ◌⃞ ◌⃟
U+20Ex ◌⃠ ◌⃡ ◌⃢ ◌⃣ ◌⃤ ◌⃥ ◌⃦ ◌⃧ ◌⃨ ◌⃩ ◌⃪ ◌⃫ ◌⃬ ◌⃭ ◌⃮ ◌⃯
U+20Fx ◌⃰
注释
1.^ 依据 Unicode 13.0
2.^ 灰色区域为未分配码位
組合半符號
Combining Half Marks
[1]
Unicode 联盟官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+FE2x ◌︠ ◌︡ ◌︢ ◌︣ ◌︤ ◌︥ ◌︦ ◌︧ ◌︨ ◌︩ ◌︪ ◌︫ ◌︬ ◌︭ ◌︮ ◌︯
注释
1.^ 依据 Unicode 13.0

注释

  1. Unicode: Combining Half Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  2. 例如,当在做windows-1258和越南资訊交換标準代碼之间的轉換時,前者使用組合字符而后者使用大量預組字符。轉換器若只是单纯地与统一碼做轉換,則会导致混亂。
  3. Unicode: Combining Diacritical Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  4. Unicode: Combining Diacritical Marks for Symbols (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  5. 5.0 5.1 5.2 5.3 Unicode: Combining Diacritical Marks Supplement (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.

参见

外部链接