Unicode數字
数字符号(又称Unicode数字)表示一个数字的字符和字符序列。相同的阿拉伯文数字广泛用于全球多种书写系统,它们使用相同的表数语义,但是在不同的书写系统之间,表示这些数字的字母存在较大差异。为了支持这些字母的差异,Unicode将这些数字编码包含在许多脚本块之中。小数在23个独立的块中重复:在阿拉伯مرات باللغة العربية中出现2次。六个附加的块还以富文本形式包含了数字,其主要是作为一个专门的数字使用的字母面板。除了各种阿拉伯语数字外,Unicode还包含了一下不常见的数字,例如:爱琴海数字、罗马数字、计数杆数字、楔形文字数字和古希腊数字。
数字符号总是会涉及字形的合成,有限数量的字符组合成为其他的数字符号。例如在阿拉伯语数字中9-9-0序列组成了数字九百九十(990)。在罗马数字中,相同的数字表示为数字符号Ⅹↀ或ⅩⅯ。它们是表示相同抽象数字的不同数字符号。数字符号的语义在其特定的组合中是不同的。阿拉伯语小数是位置-值的组合,而罗马数字是符号-值的组合并且根据其组合增减。
数字符号的数字属性
按照在文本使用的数字属性分组,Unicode有四个数值类型值。首先是“非数字(not a number)”类型。其次是十进制底数数字符号,通常用于西式数字(普通0-9),也可以是非十进制系统的数字,如罗马数字,和经过排版的十进制数,如环绕数字。
数字类型(Unicode字符属性) | ||||
---|---|---|---|---|
数字类型 | 代码 | 有数字值 | 示例 | 备注 |
非数字 | None | 否 | A X(拉丁与) α ! [ § À Д μ に 曉 와 |
数字值="NaN" |
十进制数字 | De | 是 | 0 1 9 ६(梵文字母6) ೬(坎那达语6) 𝟨(数学符号,无衬线字体) |
直接数字(十进制底数)。对应两种方式,通用类型=Nd |
十进制表意文字 | Di | 是 |
|
十进制,但经过排版 |
数字 | Nu | 是 |
|
数字值,但并非十进制底数 |
十六进制数
Unicode的十六进制数并非单独字符,而是使用现有的字母和数字。这些字符的字符属性标为Hex_digit=Yes,某些字符还标记了ASCII_Hex_digit=Yes。
标记了Hex_Digit=Yes的Unicode字符 | ||
---|---|---|
0123456789ABCDEF | 基本拉丁文、大写 | 同时ASCII_Hex_Digit=Yes |
0123456789abcdef | 基本拉丁文、小写 | 同时ASCII_Hex_Digit=Yes |
0123456789ABCDEF | 全角形式、大写 | |
0123456789abcdef | 全角形式、小写 |
不同脚本的数字符号
日语和韩语数字符号
算籌
Unicode 5.0 開始,在多文種補充平面中增加了一個區塊用於算籌數字。其包含九個「水平向」數字(U+1D360 到 U+1D368)和九個「垂直向」數字(U+1D369 到 U+1D371),水平向數字用於奇數次冪的位置,而垂直向數字用於偶數次幂的位置。而零則用 U+3007 (〇, ideographic number zero) 來表示,負數符號則使用 U+20E5 (combining reverse solidus overlay)。[1]
算籌數字 Counting Rod Numerals[1][2] Unicode Consortium 官方碼表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1D36x | 𝍠 | 𝍡 | 𝍢 | 𝍣 | 𝍤 | 𝍥 | 𝍦 | 𝍧 | 𝍨 | 𝍩 | 𝍪 | 𝍫 | 𝍬 | 𝍭 | 𝍮 | 𝍯 |
U+1D37x | 𝍰 | 𝍱 | 𝍲 | 𝍳 | 𝍴 | 𝍵 | 𝍶 | 𝍷 | 𝍸 | |||||||
註釋 |
引用
- (PDF), Unicode, Inc.: 499–500, 2006 [2013-02-18], (原始内容存档 (PDF)于2023-08-03)