介绍下Java中实现汉字转拼音的实现方式。
█ Unicode
Unicode就是将各国的文字用一个唯一的不重复的2个字节16进制编码来表示,其中包含了日文、韩文与中文字等等文字。比如汉字:一,Unicode编码为:4e00。则汉字“一”唯一对应的编码为“4e00”,“4e00”唯一表示的字符也为“一”,即“一”与“4e00”是相互对应的。
Unicode字符集:
查看Unicode字符集,请戳《Unicode字符集》
中文的Unicode编码范围:4E00-9FA5
(Unicode不区分大小写,9FA5与9fa5相同)
网页截图示例:
4E00:一;4E01:丁;