文字(Unicode)

求聞百科,共筆求聞
於 2023年9月14日 (四) 06:25 由 BXHS-bot對話 | 貢獻 所做的修訂 (机器人:清理不当的来源、移除无用的模板参数)
(差異) ←上個修訂 | 最新修訂 (差異) | 下個修訂→ (差異)

Unicode中,一種文字script)是字母和其他書面符號的一個集合,用於在一個或多個書寫系統writing system)中表示文本信息。[1]有些文字只支持一種書寫系統和語言,例如亞美尼亞語。其他文字支持許多不同的書寫系統:例如,拉丁文字支持英語法語德語意大利語越南語拉丁語本身以及其他多種語言。一些語言有多種可選的書寫系統,因而也就使用多種文字:例如,在土耳其語中,阿拉伯文字在20世紀之前使用,但在20世紀初過渡到拉丁文字。有關每種文字支持的語言列表,請參閱按文字列出的語言列表符號和Unicode控制字符某種程度上與文字互補。

統一化後的變音字符標點字符經常具有「通用」或「繼承」的文字屬性。然而,獨立的文字往往有自己的標點變音符號,以至於許多文字不僅包含字母,還包含變音符號等標記、標點、數字,甚至還有自己的特殊符號和空格字符。

Unicode 15.0定義了161種獨立的文字,包括94種現代文字和67種古代或歷史文字。[2][3]更多的文字正在編碼過程中,有的已被臨時分配予計劃中的編碼。[4]

定義和分類

當多種語言使用相同的文字時,經常會出現一些差異,特別是在變音符號和其他標記方面。例如,瑞典語和英語都使用拉丁文字。但是,瑞典語包括字符å(有時稱為瑞典語的O),而英語沒有這樣的字符。英語也沒有使用變音符號「組合用上圓圈」來表示任何字符。通常,共享相同文字的語言共享許多相同的字符。儘管瑞典語和英語書寫系統存在這些外圍差異,但它們被認為使用同一種拉丁文字。因而,Unicode對文字的抽象是一種基本的組織手段。不同字母或書寫系統之間的差異仍然存在,並通過Unicode靈活的文字、組合標記和校對算法得到支持。

文字與書寫系統

書寫系統有時被視為文字的同義詞。但是,它也可以指一種文字所支持的具體的具體書寫系統。例如,拉丁文字支持越南語書寫系統。一個書寫系統也可能涵蓋多種文字;例如,日本的書寫系統使用漢字平假名片假名

大多數書寫系統可以大致分為幾類:象形logographic)、音節syllabic)、字母alphabetic,亦稱segmental)、元音附標abugida)、輔音音素abjad)和特徵featural);然而,這些分類的所有特徵都可能以不同的比例出現在任何給定的書寫系統中,這導致通常很難對一個系統進行純粹的分類。術語複雜系統有時用於分類有困難的混合系統。

Unicode通過其眾多的文字支持所有這些類型的書寫系統。Unicode還為字符添加了更多屬性,以幫助區分各種字符以及它們在Unicode文本處理算法中的行為方式。

特殊文字屬性值

除了顯式或特定的文字屬性外,Unicode還使用三個特殊值:[5]

通用
Unicode只能將通用字符集中的一個字符分配給一種文字。但是,許多字符(不屬於正式的自然語言書寫系統的一部分,或在許多書寫系統中統一的字符)可能用於多種文字(例如貨幣符號、規約符號、數字和標點符號)。在這些情況下,Unicode將它們定義為屬於「通用」文字(ISO 15924代碼Zyyy)。
繼承
許多變音符號和非間距組合字符可以應用於來自多種文字的字符。在這些情況下,Unicode 將它們分配給「繼承」文字(ISO 15924 代碼Zinh),這意味着它們屬於與它們所組合的主要字符相同的文字類型,因此在不同的上下文中它們可能被視為屬於不同的文字。例如,U+0308  ̈  COMBINING DIAERESIS(組合用分音符)既可以與U+0065 e LATIN SMALL LETTER E(小寫拉丁字母E)組合為拉丁字母ë,也可以與U+0435 е CYRILLIC SMALL LETTER IE(小寫西里爾字母IE)組合為西里爾字母ё。在前一個例子中,它繼承了主要字符的拉丁文字屬性,而在後一個例子中繼承了西里爾文字屬性。
未知
「未知」文字值(ISO 15924 代碼Zzzz)被賦予未分配的、私用的、非字符的以及代理用的碼點。

文字中的字符類別

Unicode為每個字符提供了一個通用的類別屬性。所以每個字符除了屬於一種文字之外,還從屬於一個類別。通常的文字由字母字符組成,包括:大寫字母、小寫字母和修飾字母。一些字符被認為是一些預組的連字的標題字母,例如Dz(U+01F2)。此類標題連字均採用拉丁語和希臘語文字,並且都是兼容字符,因此Unicode不鼓勵使用它們。將來不太可能添加新的標題字母。

大多數書寫系統不區分大小寫字母。對於這些文字,所有字母都歸類為「其他字母」或「修飾字母」。中日韓統一表意文字等表意文字也被歸類為「其他字母」。然而,一些文字確實區分了大寫和小寫:拉丁文字、西里爾文字、希臘文字、亞美尼亞文字、格魯吉亞文字和沙漠文字,但即使對於這些文字,也有一些字母既不是大寫也不是小寫。

文字還可以包含任何其他一般類別字符,例如標記(變音符號和其他)、數字(數字)、標點符號分隔符(單詞分隔符,例如空格)、符號和非圖形格式字符。當它們僅被特定文字使用時,它們會包含在特定文字中,否則通常會被統一化並包含在標點符號或變音符號區塊中。但是,任何文字(除了「通用」和「繼承:文字)中的大部分字符都是字母。

Unicode中的文字列表

Unicode根據 ISO 15924列表定義了一百多個文字名稱(稱為「別名」或「屬性值別名」)。Unicode對ISO 15924的Zyyy(未確定文字的代碼)使用「通用」名稱,對ISO 15924的Zinh(繼承文字的代碼)使用「繼承」,對ISO 15924的Zzzz(未編碼文字的代碼)使用「未知」。此外,ISO 15924文字代碼Zsym(符號)和Zmth(數學符號)未被使用,它們不被認為是Unicode意義上的文字。

ISO 15924文字代碼[a][b]Unicode[c][d]
ISO 15924 Unicode收錄的文字[e]
代碼 No. ISO 15924
名稱
中文名稱 別名[f] 方向 版本 字元數 備註
Adlm 166 Adlam 富拉語文字 Adlam 右至左 9.0 88
Afak 439 Afaka 阿法卡音節文字 左至右 未被Unicode收錄, proposal under review by the Unicode Technical Committee[6][7]
Aghb 239 Caucasian Albanian 高加索阿爾巴尼亞文 Caucasian Albanian 左至右 7.0 53 古代/歷史文字
Ahom 338 Ahom, Tai Ahom 阿洪姆文 Ahom 左至右 8.0 58 古代/歷史文字
Arab 160 Arabic 阿拉伯文 Arabic 混合方向 1.0 1,281
Aran 161 Arabic (Nastaliq variant) 波斯體阿拉伯文 右至左 Typographic variant of Arabic
Armi 124 Imperial Aramaic 阿拉米字母 Imperial Aramaic 混合方向 5.2 31 古代/歷史文字
Armn 230 Armenian 亞美尼亞字母 Armenian 左至右 1.0 95
Avst 134 Avestan 阿維斯陀字母 Avestan 混合方向 5.2 61 古代/歷史文字
Bali 360 Balinese 峇里字母 Balinese 左至右 5.0 121
Bamu 435 Bamum 巴姆穆文字 Bamum 左至右 5.2 657
Bass 259 Bassa Vah 巴薩文 Bassa Vah 左至右 7.0 36 古代/歷史文字
Batk 365 Batak 巴塔克文 Batak 左至右 6.0 56
Beng 325 Bengali (Bangla) 孟加拉文 Bengali 左至右 1.0 96
Bhks 334 Bhaiksuki 拜克舒基文 Bhaiksuki 左至右 9.0 97 古代/歷史文字
Blis 550 Blissymbols 布力辛博文 左至右 未被Unicode收錄, proposal in initial/exploratory stage[6]
Bopo 285 Bopomofo 注音符號 Bopomofo 左至右 1.0 72
Brah 300 Brahmi 婆羅米文 Brahmi 左至右 6.0 109 古代/歷史文字
Brai 570 Braille 點字 Braille 左至右 3.0 256
Bugi 367 Buginese 布吉文 Buginese 左至右 4.1 30
Buhd 372 Buhid 布希德文 Buhid 左至右 3.2 20
Cakm 349 Chakma 查克馬文 Chakma 左至右 6.1 70
Cans 440 Unified Canadian Aboriginal Syllabics 加拿大原住民音節文字 Canadian Aboriginal 左至右 3.0 710
Cari 201 Carian 卡里亞字母 Carian 左至右 5.1 49 古代/歷史文字
Cham 358 Cham 占文 Cham 左至右 5.1 83
Cher 445 Cherokee 切羅基文 Cherokee 左至右 3.0 172
Chrs Writing system 未被Unicode收錄
Cirt 291 Cirth 克爾斯文 左至右 未被Unicode收錄
Copt 204 Coptic 科普特字母 Coptic 左至右 1.0 137 古代/歷史文字, Disunified from Greek in 4.1
Cpmn Writing system 未被Unicode收錄
Cprt 403 Cypriot syllabary 塞浦路斯音節文字 Cypriot 混合方向 4.0 55 古代/歷史文字
Cyrl 220 Cyrillic 西里爾字母 Cyrillic 左至右 1.0 443
Cyrs 221 Cyrillic (Old Church Slavonic variant) 早期西里爾字母 左至右 古代/歷史文字, typographic variant of Cyrillic
Deva 315 Devanagari (Nagari) 天城文 Devanagari 左至右 1.0 154
Diak Writing system 未被Unicode收錄
Dogr Writing system 11.0 60 古代/歷史文字
Dsrt 250 Deseret (Mormon) 德瑟雷特字母 Deseret 左至右 3.1 80
Dupl 755 Duployan shorthand, Duployan stenography 杜普雷速記 Duployan 左至右 7.0 143
Egyd 070 Egyptian demotic 世俗體 右至左 未被Unicode收錄
Egyh 060 Egyptian hieratic 僧侶體 右至左 未被Unicode收錄
Egyp 050 Egyptian hieroglyphs 聖書體 Egyptian Hieroglyphs 左至右 5.2 1,080 古代/歷史文字
Elba 226 Elbasan 愛爾巴桑字母 Elbasan 左至右 7.0 40 古代/歷史文字
Elym Writing system 12.0 23 古代/歷史文字
Ethi 430 Ethiopic (Geʻez) 吉茲字母 Ethiopic 左至右 3.0 495
Geok 241 Khutsuri (Asomtavruli and Nuskhuri) 喬治亞文小草體 Georgian 左至右 Unicode groups Geok and Geor together as "Georgian"
Geor 240 Georgian (Mkhedruli and Mtavruli) 喬治亞文騎士體 Georgian 左至右 1.0 173 For Unicode, see also Geok
Glag 225 Glagolitic 格拉哥里字母 Glagolitic 左至右 4.1 132 古代/歷史文字
Gong Writing system 11.0 63
Gonm Writing system 10.0 75
Goth 206 Gothic 哥德字母 Gothic 左至右 3.1 27 古代/歷史文字
Gran 343 Grantha 古蘭塔文 Grantha 左至右 7.0 85 古代/歷史文字
Grek 200 Greek 希臘字母 Greek 左至右 1.0 518 Sometimes expressed as boustrophedon (mirroring of alternate lines rather than purely left-to-right)
Gujr 320 Gujarati 古吉拉特文 Gujarati 左至右 1.0 91
Guru 310 Gurmukhi 古木基文 Gurmukhi 左至右 1.0 80
Hanb 503 Han with Bopomofo (alias for Han + Bopomofo) 漢字(帶注音符號) 左至右 See Hani, Bopo
Hang 286 Hangul (Hangŭl, Hangeul) 諺文 Hangul 左至右 1.0 11,739 Hangul syllables relocated in 2.0
Hani 500 Han (Hanzi, Kanji, Hanja) 漢字(中文漢字、日本漢字、韓國漢字) Han 左至右 1.0 89,233
Hano 371 Hanunoo (Hanunóo) 哈努諾字母 Hanunoo 左至右 3.2 21
Hans 501 Han (Simplified variant) 簡體中文 左至右 Subset Hani
Hant 502 Han (Traditional variant) 繁體中文 左至右 Subset Hani
Hatr 127 Hatran 哈特拉文 Hatran 混合方向 8.0 26 古代/歷史文字
Hebr 125 Hebrew 希伯來文 Hebrew 混合方向 1.0 134
Hira 410 Hiragana 平假名 Hiragana 左至右 1.0 379
Hluw 080 Anatolian Hieroglyphs (Luwian Hieroglyphs, Hittite Hieroglyphs) 安納托利亞象形文字 Anatolian Hieroglyphs 左至右 8.0 583 古代/歷史文字
Hmng 450 Pahawh Hmong 救世苗文 Pahawh Hmong 左至右 7.0 127
Hmnp Writing system 12.0 71
Hrkt 412 Japanese syllabaries (alias for Hiragana + Katakana) 假名 Katakana or Hiragana 左至右 See Hira, Kana
Hung 176 Old Hungarian (Hungarian Runic) 古匈牙利字母 Old Hungarian 混合方向 8.0 108 古代/歷史文字
Inds 610 Indus (Harappan) 印度河文字 右至左 未被Unicode收錄, proposal in initial/exploratory stage[6]
Ital 210 Old Italic (Etruscan, Oscan, etc.) 古意大利字母 Old Italic 左至右 3.1 39 古代/歷史文字
Jamo 284 Jamo (alias for Jamo subset of Hangul) 韓語字母 左至右 Subset Hang
Java 361 Javanese 爪哇字母 Javanese 左至右 5.2 90
Jpan 413 Japanese (alias for Han + Hiragana + Katakana) 日文文字 左至右 See Hani, Hira and Kana
Jurc 510 Jurchen 女真文 左至右 未被Unicode收錄
Kali 357 Kayah Li 克耶里字母 Kayah Li 左至右 5.1 47
Kana 411 Katakana 片假名 Katakana 左至右 1.0 304
Khar 305 Kharoshthi 佉盧文 Kharoshthi 混合方向 4.1 68 古代/歷史文字
Khmr 355 Khmer 高棉文 Khmer 左至右 3.0 146
Khoj 322 Khojki 可吉文 Khojki 左至右 7.0 62 古代/歷史文字
Kitl 505 Khitan large script 契丹大字 左至右 未被Unicode收錄
Kits 288 Khitan small script 契丹小字 上至下 未被Unicode收錄
Knda 345 Kannada 卡納達文 Kannada 左至右 1.0 89
Kore 287 Korean (alias for Hangul + Han) 韓漢混用文 左至右 See Hani and Hang
Kpel 436 Kpelle 克培列文 左至右 未被Unicode收錄, proposal in initial/exploratory stage[6]
Kthi 317 Kaithi 凱提文 Kaithi 左至右 5.2 67 古代/歷史文字
Lana 351 Tai Tham (Lanna) 老傣文 Tai Tham 左至右 5.2 127
Laoo 356 Lao 寮文 Lao 左至右 1.0 82
Latf 217 Latin (Fraktur variant) 德文尖角體 左至右 Typographic variant of Latin
Latg 216 Latin (Gaelic variant) 蓋爾體 左至右 Typographic variant of Latin
Latn 215 Latin 拉丁字母 Latin 左至右 1.0 1,366 See Latin script in Unicode
Leke 364 Leke 勒克文 左至右 未被Unicode收錄
Lepc 335 Lepcha (Róng) 絨巴文 Lepcha 左至右 5.1 74
Limb 336 Limbu 林布文 Limbu 左至右 4.0 68
Lina 400 Linear A 線形文字A Linear A 左至右 7.0 341 古代/歷史文字
Linb 401 Linear B 線形文字B Linear B 左至右 4.0 211 古代/歷史文字
Lisu 399 Lisu (Fraser) 老傈僳文 Lisu 左至右 5.2 48
Loma 437 Loma 洛瑪文 左至右 未被Unicode收錄, proposal in initial/exploratory stage[6]
Lyci 202 Lycian 呂基亞字母 Lycian 左至右 5.1 29 古代/歷史文字
Lydi 116 Lydian 呂底亞字母 Lydian 混合方向 5.1 27 古代/歷史文字
Mahj 314 Mahajani 馬哈佳尼文 Mahajani 左至右 7.0 39 古代/歷史文字
Maka Writing system 11.0 25 古代/歷史文字
Mand 140 Mandaic, Mandaean 曼達安字母 Mandaic 混合方向 6.0 29
Mani 139 Manichaean 摩尼字母 Manichaean 混合方向 7.0 51 古代/歷史文字
Marc 332 Marchen 象雄文 Marchen 左至右 9.0 68 古代/歷史文字
Maya 090 Mayan hieroglyphs 瑪雅文字 混合方向 未被Unicode收錄
Medf Writing system 11.0 91
Mend 438 Mende Kikakui 門德基卡庫文 Mende Kikakui 混合方向 7.0 213
Merc 101 Meroitic Cursive 麥羅埃文草書體 Meroitic Cursive 混合方向 6.1 90 古代/歷史文字
Mero 100 Meroitic Hieroglyphs 麥羅埃文聖書體 Meroitic Hieroglyphs 混合方向 6.1 32 古代/歷史文字
Mlym 347 Malayalam 馬拉雅拉姆文 Malayalam 左至右 1.0 117
Modi 324 Modi, Moḍī 莫迪文 Modi 左至右 7.0 79 古代/歷史文字
Mong 145 Mongolian 蒙古文 Mongolian 上至下 3.0 167 Includes Clear, Manchu scripts
Moon 218 Moon (Moon code, Moon script, Moon type) 穆恩字母 混合方向 未被Unicode收錄, proposal in initial/exploratory stage[6]
Mroo 264 Mro, Mru 默祿文 Mro 左至右 7.0 43
Mtei 337 Meitei Mayek (Meithei, Meetei) 梅泰文 Meetei Mayek 左至右 5.2 79
Mult 323 Multani 穆爾塔尼文 Multani 左至右 8.0 38 古代/歷史文字
Mymr 350 Myanmar (Burmese) 緬文 Myanmar 左至右 3.0 223
Nand Writing system 12.0 65 古代/歷史文字
Narb 106 Old North Arabian (Ancient North Arabian) 古北阿拉伯字母 Old North Arabian 混合方向 7.0 32 古代/歷史文字
Nbat 159 Nabataean 納巴泰字母 Nabataean 混合方向 7.0 40 古代/歷史文字
Newa 333 Newa, Newar, Newari, Nepāla lipi 普拉卡利特文 Newa 左至右 9.0 94
Nkdb Writing system 未被Unicode收錄
Nkgb 420 Nakhi Geba (na²¹ɕi³³ gʌ²¹ba²¹, 'Na-'Khi ²Ggŏ-¹baw, Nakhi Geba) 哥巴文 左至右 未被Unicode收錄, proposal in initial/exploratory stage[6]
Nkoo 165 N』Ko 西非書面文字 NKo 混合方向 5.0 62
Nshu 499 Nüshu 女書 Nushu 左至右 10.0 397
Ogam 212 Ogham 歐甘字母 Ogham 混合方向 3.0 29 古代/歷史文字
Olck 261 Ol Chiki (Ol Cemet』, Ol, Santali) 桑塔利文 Ol Chiki 左至右 5.1 48
Orkh 175 Old Turkic, Orkhon Runic 古突厥文 Old Turkic 混合方向 5.2 73 古代/歷史文字
Orya 327 Oriya (Odia) 奧里亞文 Oriya 左至右 1.0 90
Osge 219 Osage 歐塞奇字母 Osage 左至右 9.0 72
Osma 260 Osmanya 奧斯曼亞字母 Osmanya 左至右 4.0 40
Palm 126 Palmyrene 帕爾邁拉字母 Palmyrene 混合方向 7.0 32 古代/歷史文字
Pauc 263 Pau Cin Hau 包欽豪文 Pau Cin Hau 左至右 7.0 57
Perm 227 Old Permic 古彼爾姆文 Old Permic 左至右 7.0 43 古代/歷史文字
Phag 331 Phags-pa 八思巴字 Phags-pa 上至下 5.0 56 古代/歷史文字
Phli 131 Inscriptional Pahlavi 碑刻巴列維文 Inscriptional Pahlavi 混合方向 5.2 27 古代/歷史文字
Phlp 132 Psalter Pahlavi 詩篇巴列維文 Psalter Pahlavi 右至左 7.0 29 古代/歷史文字
Phlv 133 Book Pahlavi 書本巴列維文 右至左 未被Unicode收錄
Phnx 115 Phoenician 音標 Phoenician 右至左 5.0 29 古代/歷史文字
Piqd 293 Klingon (KLI pIqaD) 克林貢文 左至右 Rejected for inclusion in the Unicode Standard[8][9]
Plrd 282 Miao (Pollard) 柏格理苗文 Miao 左至右 6.1 149
Prti 130 Inscriptional Parthian 碑刻帕提亞文 Inscriptional Parthian 右至左 5.2 30 古代/歷史文字
Qaaa 900 Reserved for private use (start) 私人使用區(開始) 未被Unicode收錄
Qaai 908 (Private use) (私人用途) 未被Unicode收錄 (Before version 5.2, this was used instead of Zinh)
Qabx 949 Reserved for private use (end) 私人使用區(結束) 未被Unicode收錄
Rjng 363 Rejang (Redjang, Kaganga) 勒姜字母 Rejang 左至右 5.1 37
Rohg Writing system 11.0 50
Roro 620 Rongorongo 朗格朗格 混合方向 未被Unicode收錄, proposal in initial/exploratory stage[6]
Runr 211 Runic 盧恩字母 Runic 左至右 3.0 86 古代/歷史文字
Samr 123 Samaritan 撒瑪利亞字母 Samaritan 右至左 5.2 61
Sara 292 Sarati 沙拉堤文字 混合方向 未被Unicode收錄
Sarb 105 Old South Arabian 古南阿拉伯字母 Old South Arabian 右至左 5.2 32 古代/歷史文字
Saur 344 Saurashtra 索拉什特拉文 Saurashtra 左至右 5.1 82
Sgnw 095 SignWriting 手語書寫符號 SignWriting 上至下 8.0 672
Shaw 281 Shavian (Shaw) 蕭伯納字母 Shavian 左至右 4.0 48
Shrd 319 Sharada, Śāradā 夏拉達文 Sharada 左至右 6.1 94
Shui Writing system 未被Unicode收錄
Sidd 302 Siddham, Siddhaṃ, Siddhamātṛkā 悉曇文字 Siddham 左至右 7.0 92 古代/歷史文字
Sind 318 Khudawadi, Sindhi 庫達巴蒂文 Khudawadi 左至右 7.0 69
Sinh 348 Sinhala 僧伽羅文 Sinhala 左至右 3.0 110
Sogd Writing system 11.0 42 古代/歷史文字
Sogo Writing system 11.0 40 古代/歷史文字
Sora 398 Sora Sompeng 索拉僧平字母 Sora Sompeng 左至右 6.1 35
Soyo Writing system 10.0 83 古代/歷史文字
Sund 362 Sundanese 巽他字母 Sundanese 左至右 5.1 72
Sylo 316 Syloti Nagri 錫爾赫特城文 Syloti Nagri 左至右 4.1 44
Syrc 135 Syriac 敘利亞字母 Syriac 右至左 3.0 88
Syre 138 Syriac (Estrangelo variant) 敘利亞字母古典體 右至左 敘利亞字母的印刷變體
Syrj 137 Syriac (Western variant) 敘利亞字母西部變體 右至左 敘利亞字母的印刷變體
Syrn 136 Syriac (Eastern variant) 敘利亞字母東部變體 右至左 敘利亞字母的印刷變體
Tagb 373 Tagbanwa 塔格巴努亞文 Tagbanwa 左至右 3.2 18
Takr 321 Takri, Ṭākrī, Ṭāṅkrī 塔克里字母 Takri 左至右 6.1 67
Tale 353 Tai Le 傣仂文 Tai Le 左至右 4.0 35
Talu 354 New Tai Lue 新傣仂文 New Tai Lue 左至右 4.1 83
Taml 346 Tamil 泰米爾文 Tamil 左至右 1.0 123
Tang 520 Tangut 西夏文 Tangut 左至右 9.0 6,892 古代/歷史文字
Tavt 359 Tai Viet 傣擔文 Tai Viet 左至右 5.2 72
Telu 340 Telugu 泰盧固文 Telugu 左至右 1.0 98
Teng 290 Tengwar 滕格瓦字母 左至右 未被Unicode收錄
Tfng 120 Tifinagh (Berber) 提非納文 Tifinagh 左至右 4.1 59
Tglg 370 Tagalog (Baybayin, Alibata) 貝貝因文 Tagalog 左至右 3.2 20
Thaa 170 Thaana 它拿字母 Thaana 右至左 3.0 50
Thai 352 Thai 泰文 Thai 左至右 1.0 86
Tibt 330 Tibetan 藏文 Tibetan 左至右 2.0 207 Added in 1.0, removed in 1.1 and reintroduced in 2.0
Tirh 326 Tirhuta 底羅仆多文 Tirhuta 左至右 7.0 82
Ugar 040 Ugaritic 烏加里特字母 Ugaritic 左至右 4.0 31 古代/歷史文字
Vaii 470 Vai 瓦伊文 Vai 左至右 5.1 300
Visp 280 Visible Speech 可視語言 左至右 未被Unicode收錄
Wara 262 Warang Citi (Varang Kshiti) 瓦蘭齊地文 Warang Citi 左至右 7.0 84
Wcho Writing system 12.0 59
Wole 480 Woleai 沃萊艾文 右至左 未被Unicode收錄, proposal in initial/exploratory stage[6]
Xpeo 030 Old Persian 古波斯楔形文字 Old Persian 左至右 4.1 50 古代/歷史文字
Xsux 020 Cuneiform, Sumero-Akkadian 楔形文字 Cuneiform 左至右 5.0 1,234 古代/歷史文字
Yezi Writing system 未被Unicode收錄
Yiii 460 Yi 彝文 Yi 左至右 3.0 1,220
Zanb Writing system 10.0 72 古代/歷史文字
Zinh 994 Code for inherited script 繼承文字 Inherited 繼承 571
Zmth 995 Mathematical notation 數學符號 左至右 Not a 'script' in Unicode
Zsym 996 Symbols 符號 Not a 'script' in Unicode
Zsye 993 Symbols (emoji variant) 顏文字 Not a 'script' in Unicode
Zxxx 997 Code for unwritten documents 不成文 Not a 'script' in Unicode
Zyyy 998 Code for undetermined script 未定 Common 混合方向 7,805
Zzzz 999 Code for uncoded script 未編碼 Unknown 976,118 All other code points
附註
  1. ^ ISO 15924 publications 截至2019年8月19日 (2019-08-19)
  2. ^ ISO 15924 Normative text file 截至2019年8月19日 (2019-08-19)
  3. ^ ISO 15924 Changes (including Aliases for Unicode; 截至2019年8月19日 (2019-08-19))
  4. ^ Unicode version 12.1
  5. ^ Unicode charts
  6. ^ Unicode uses the "Property Value Alias" (Alias) as the script-name. These Alias names are part of Unicode and are published informatively next to ISO 15924

Unicode中缺少的文字

隨着Unicode的每個新版本發佈,國際字符代碼中都添加了新的書寫系統。根據加州大學伯克利分校的語言學家Deborah Anderson博士的一份聲明,Unicode中尚有100多種書寫系統未包含。

根據德國美因茨應用科學大學、法國ANRT Nancy和美國加州大學伯克利分校的項目「Missing Scripts」清單,根據目前的研究狀況(2022年1月),人類已知的書寫系統有294種。其中131個尚未以Unicode編碼,即尚不能在計算機或手機上使用。

參見

參考資料

  1. Glossary. unicode.org. [2022-10-24]. 
  2. Unicode Character Database: Scripts. unicode.org. [2022-10-24]. 
  3. Chapter 14: Additional Ancient and Historic Scripts (PDF). Mountain View, CA: Unicode, Inc. September 2022 [2022-10-24]. ISBN 978-1-936213-32-0. 
  4. https://www.unicode.org/roadmaps/ Roadmaps to Unicode
  5. UAX #24: Unicode Script Property. www.unicode.org. [2022-10-24]. 
  6. 6.0 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 Proposed New Scripts. Unicode Consortium. 2018-05-25 [2018-09-12]. 
  7. Roadmap to the SMP. Unicode Consortium. 2018-08-08 [2018-09-12]. 
  8. Michael Everson. Proposal to encode Klingon in Plane 1 of ISO/IEC 10646-2. 1997-09-18. 
  9. The Unicode Consortium. Approved Minutes of the UTC 87 / L2 184 Joint Meeting. 2001-08-14. 

外部連結

  • Script Encoding Initiative ,美國加州大學伯克利分校的一個項目,致力於讓更多的文字包含在Unicode標準中。
  • The World's Writing Systems ,所有 94種已知書寫系統的概述,每個系統都有一個印刷參考字形及其Unicode狀態。