Mac自带的输入法Unicode十六进制输入,输入补充平面的字符的方式

Mac在键盘里面可以添加Unicode十六进制输入,具体不多说。使用的时候,就是按住Option键输入。

对于在基本多文种平面的字符,也就是Unicode为四位十六进制的,直接输入相应的Unicode码即可。然而对于在补充平面的字符,Unicode十六进制位数大于四,他就不是直接输入Unicode码。实际上,Mac的这个键盘输入,使用的是UTF-16BE的编码方式进行输入的。具体内容同样可以自行搜索相关资料。

简单来说,对于补充平面的字符,UTF-16使用两个16位的编码单元,也就是两个四位十六进制数进行表示,称为代理对。这两个依次是高代理和低代理。UTF-16有两种字节序变体,分别为大端BE和小端LE,决定了这两个编码单元内的字节表示顺序。

也就是说,如果要用Mac自带的这个键盘输入补充平面的字符,需要自己先计算所要写入的字符的两个代理对的Unicode码,然后依次输入这两个码位。虽说计算公式算比较简单,然而进行这样的计算过程,这个精力都足够用来直接得到所需字符了。比如使用Python,直接能由Unicode码得到相应的字符,根本不需要自己计算的功夫。

这样看来,Mac的这个键盘还是有点鸡肋的。对于基本多文种平面的可能还好,补充平面的就不方便了。而微软拼音输入法,能使用V模式输入Unicode码,从而输入任意所需的字符。比如输入VUC9999能得到字,输入VUC20000能得到𠀀字。


Mac自带的输入法Unicode十六进制输入,输入补充平面的字符的方式
https://sunboyallen.github.io/mac-ime-unicode/
作者
sunboyallen
发布于
2024年2月3日
许可协议