Help:Unicode扩展汉字:修订间差异

帮助页面
添加的内容 删除的内容
无编辑摘要
无编辑摘要
第7行: 第7行:
2023年8月1日实施的中华人民共和国国家标准《信息技术 中文编码字符集》(GB 18030-2022)一方面是Unicode的完全对应编码,另一方面也对包括求闻百科(网站及基础设施)及阅读、编辑求闻百科所使用的软件、浏览器等的汉字支持程度提出了新的要求。
2023年8月1日实施的中华人民共和国国家标准《信息技术 中文编码字符集》(GB 18030-2022)一方面是Unicode的完全对应编码,另一方面也对包括求闻百科(网站及基础设施)及阅读、编辑求闻百科所使用的软件、浏览器等的汉字支持程度提出了新的要求。


求闻百科所使用的共笔软件系统、数据库等不是汉字敏感的,亦即,其能接受并传输任何Unicode字符,包括GB 18030-2022、其第1号修改单(预计于2024年内发布)、后续修改单以及Unicode目前及今后规定的全部汉字少数民族文字。求闻百科所使用的数据库表为“MariaDB utf8mb4”格式,支持存储整个Unicode编码空间内的全部字符。求闻百科唯一的汉字敏感的组件是提供“分类内按拼音排序”功能的扩展,其将按Unicode修订计划定期更新。因此,读者、编者所使用的操作系统、浏览器、字体字库等对GB 18030-2022及Unicode的支持对能否正常显示汉字至关重要。然而非常令人遗憾的是,由于Unicode的更新速度非常快,市面上的绝大多数设备和浏览器都有机会出现缺字的情形,导致字符显示为方格、乱码、内码方块、问号或空格等,影响用户使用体验。
求闻百科所使用的共笔软件系统、数据库等不是汉字敏感的,亦即,其能接受并传输任何Unicode字符,包括GB 18030-2022、其第1号修改单(预计于2024年内发布)、后续修改单以及Unicode目前及今后规定的全部汉字少数民族文字和全世界其他各民族使用的文字。求闻百科所使用的数据库表为“MariaDB utf8mb4”格式,支持存储整个Unicode编码空间内的全部字符。求闻百科唯一的汉字敏感的组件是提供“分类内按拼音排序”功能的扩展,其将按Unicode修订计划定期更新。因此,读者、编者所使用的操作系统、浏览器、字体字库等对GB 18030-2022及Unicode的支持对能否正常显示汉字至关重要。然而非常令人遗憾的是,由于Unicode的更新速度非常快,市面上的绝大多数设备和浏览器都有机会出现缺字的情形,导致字符显示为方格、乱码、内码方块、问号或空格等,影响用户使用体验。


除此之外,Unicode將大部分在來源編碼中分開編碼,但按漢字統一標準同屬一字的漢字分入「兼容漢字」區,以便達成無損來回轉換。除了專門處理某來源編碼「一字多形」的字型之外,大部分字型都將兼容區的漢字按其對應的普通字形呈現。因此,若想要分開顯示JIS X 0213:2004中「{{lang|ja|賓}}」(U+8CD3)的舊字形「{{lang|ja|賓}}」(U+FA64),就需要安裝特殊字型。<ref>從Unicode的本身角度說,新舊字形不應使用「相容功能」表示,而應該通過[http://unicode.org/ivd/ 表意文字變種資料庫]中的后缀序列指定。要表示舊字形的「{{lang|ja|賓}}」,可以在[http://www.unicode.org/ivd/data/2016-08-15/IVD_Charts_Adobe-Japan1.pdf Adobe-Japan1對照表]查到8CD3的E0101號變體,使用(U+8CD3 U+E0101)序列表示。</ref>
除此之外,Unicode將大部分在來源編碼中分開編碼,但按漢字統一標準同屬一字的漢字分入「兼容漢字」區,以便達成無損來回轉換。除了專門處理某來源編碼「一字多形」的字型之外,大部分字型都將兼容區的漢字按其對應的普通字形呈現。因此,若想要分開顯示JIS X 0213:2004中「{{lang|ja|賓}}」(U+8CD3)的舊字形「{{lang|ja|賓}}」(U+FA64),就需要安裝特殊字型。<ref>從Unicode的本身角度說,新舊字形不應使用「相容功能」表示,而應該通過[http://unicode.org/ivd/ 表意文字變種資料庫]中的后缀序列指定。要表示舊字形的「{{lang|ja|賓}}」,可以在[http://www.unicode.org/ivd/data/2016-08-15/IVD_Charts_Adobe-Japan1.pdf Adobe-Japan1對照表]查到8CD3的E0101號變體,使用(U+8CD3 U+E0101)序列表示。</ref>