Mac 自带的输入法 Unicode 十六进制输入,输入补充平面的字符的方式

Mac 在键盘里面可以添加 Unicode 十六进制输入,具体不多说。使用的时候,就是按住Option键输入。

对于在基本多文种平面的字符,也就是 Unicode 为四位十六进制的,直接输入相应的 Unicode 码即可。然而对于在补充平面的字符,Unicode 十六进制位数大于四,他就不是直接输入 Unicode 码。实际上,Mac 的这个键盘输入,使用的是 UTF-16BE 的编码方式进行输入的。具体内容同样可以自行搜索相关资料。

简单来说,对于补充平面的字符,UTF-16 使用两个 16 位的编码单元,也就是两个四位十六进制数进行表示,称为代理对。这两个依次是高代理和低代理。UTF-16 有两种字节序变体,分别为大端 BE 和小端 LE,决定了这两个编码单元内的字节表示顺序。

也就是说,如果要用 Mac 自带的这个键盘输入补充平面的字符,需要自己先计算所要写入的字符的两个代理对的 Unicode 码,然后依次输入这两个码位。虽说计算公式算比较简单,然而进行这样的计算过程,这个精力都足够用来直接得到所需字符了。比如使用 Python,直接能由 Unicode 码得到相应的字符,根本不需要自己计算的功夫。

这样看来,Mac 的这个键盘还是有点鸡肋的。对于基本多文种平面的可能还好,补充平面的就不方便了。而微软拼音输入法,能使用 V 模式输入 Unicode 码,从而输入任意所需的字符。比如输入VUC9999能得到字,输入VUC20000能得到𠀀字。


Mac 自带的输入法 Unicode 十六进制输入,输入补充平面的字符的方式
https://sunboyallen.github.io/mac-ime-unicode/
作者
sunboyallen
发布于
2024年2月3日
许可协议