Unicode数字

求闻百科,共笔求闻

数字符号(又称Unicode数字)表示一个数字的字符和字符序列。相同的阿拉伯文数字广泛用于全球的多种书写系统,它们使用相同的表数语义,但是在不同的书写系统之间,表示这些数字的字母存在较大差异。为了支持这些字母的差异,Unicode将这些数字编码包含在许多脚本块之中。小数在23个独立的块中重复:在阿拉伯مرات باللغة العربية中出现2次。六个附加的块还以富文本形式包含了数字,其主要是作为一个专门的数字使用的字母面板。除了各种阿拉伯语数字外,Unicode还包含了一下不常见的数字,例如:爱琴海数字、罗马数字、计数杆数字、楔形文字数字和古希腊数字。

数字符号总是会涉及字形的合成,有限数量的字符组合成为其他的数字符号。例如在阿拉伯语数字中9-9-0序列组成了数字九百九十(990)。在罗马数字中,相同的数字表示为数字符号Ⅹↀ或ⅩⅯ。它们是表示相同抽象数字的不同数字符号。数字符号的语义在其特定的组合中是不同的。阿拉伯语小数是位置-值的组合,而罗马数字是符号-值的组合并且根据其组合进行增减。

数字符号的数字属性

按照在文本中使用的数字属性进行分组,Unicode拥有四个数值类型值。首先是“非数字(not a number)”类型。其次是十进制底数数字符号,通常用于西式数字(普通0-9),也可以是非十进制系统中的数字,例如罗马数字,和经过排版的十进制数,例如环绕数字。

数字类型(Unicode字符属性)
数字类型 代码 有数字值 示例 备注
非数字 None
  • A
  • X(拉丁与)
  • α
  • !
  • [
  • §
  • À
  • Д
  • μ
数字值="NaN"
十进制数字 De
  • 0
  • 1
  • 9
  • ६(梵文字母6)
  • ೬(坎那达语6)
  • 𝟨(数学符号,无衬线字体)
直接数字(十进制底数)。对应两种方式,通用类型=Nd
十进制表意文字 Di
  • ¹(上标)
  • ⒈(包含句号的数字)
十进制,但经过排版
数字 Nu
  • ¾
  • ௰(泰米尔语数字十)
  • Ⅹ(罗马数字符号)
  • 六(汉语数字6)
  • 壹(汉语,用于会计时的值1)
数字值,但并非十进制底数

十六进制数

Unicode中的十六进制数并非单独的字符,而是使用现有的字母和数字。这些字符的字符属性被标为Hex_digit=Yes,某些字符还标记了ASCII_Hex_digit=Yes。

标记了Hex_Digit=Yes的Unicode字符
0123456789ABCDEF 基本拉丁文、大写 同时ASCII_Hex_Digit=Yes
0123456789abcdef 基本拉丁文、小写 同时ASCII_Hex_Digit=Yes
0123456789ABCDEF 全角形式、大写
0123456789abcdef 全角形式、小写

不同脚本的数字符号

阿拉不要数字

小数

十进制小数

无理数、集合和其他常量的字符

富文本和其他兼容数字符号

中日韩花码数字符号numerals

Unicode中的花码数字符号

日语和韩语数字符号

古希腊数字

罗马数字

计数棒数字符号

Unicode中的计数棒数字符号

引用