连词字符

求闻百科,共笔求闻

连词字符(英语:Word joiner,简称“WJ”)是一个在Unicode中的格式字符,于部分不使用显式间距(explicit spacing)的语言中用作表达一个不应出现分字的地方。该字符自Unicode 3.2版本(2002年发布)起,以U+2060 WORD JOINER ,HTML:⁠收录。连词字符不会产生任何空格,故可防止相关位置出现自动换行的情况。[1]

连词字符取代了零宽不换行空格(zero width no-break space,ZWNBSP)字元(一个不建议采用的Unicode字符,其编码为U+FEFF)。U+FEFF字元原拟用于文件开首的位元组顺序记号(Byte Order Mark,BOM),但根据Unicode标准,若该字元非在上述情况下使用,则应视为“零宽不换行空格”般使用。在Unicode 3.2版本起,Unicode联盟不再建议这种故意采用U+FEFF的方式,并强烈建议采用连词字符。[1][2]

参见

参考资料

  1. 1.0 1.1 Layout Controls (PDF). The Unicode Standard, Version 12.0.0 (The Unicode Consortium). : 871. 
  2. FAQ - UTF-8, UTF-16, UTF-32 & BOM, "What should I do with U+FEFF in the middle of a file?". The Unicode Consortium. [2021-06-19] (英语).