NC过程中遇到中文转拼音问题
在对接接口时,遇到了中文要转拼音的问题,一开始还真没想明白,因为头一次遇到,经过一系列查阅,还是轻松解决了。
一、了解pinyin4j
pinyin4j是一个流行的Java库,支持中文字符和拼音之间的转换。拼音输出格式可以定制(具体实现见文末)。
设置声调格式:
outputFormat.setToneType(HanyuPinyinToneType);
方法参数HanyuPinyinToneType有以下常量对象:
HanyuPinyinToneType.WITH_TONE_NUMBER 用数字表示声调,例如:liu2
HanyuPinyinToneType.WITHOUT_TONE 无声调表示,例如:liu
HanyuPinyinToneType.WITH_TONE_MARK 用声调符号表示,例如:liú
设置特殊拼音ü的显示格式:
outputFormat.setVCharType(HanyuPinyinVCharType);
方法参数HanyuPinyinVCharType有以下常量对象:
HanyuPinyinVCharType.WITH_U_AND_COLON 以U和一个冒号表示该拼音,例如:lu:
HanyuPinyinVCharType.WITH_V 以V表示该字符,例如:lv
HanyuPinyinVCharType.WITH_U_UNICODE 以ü表示
设置大小写格式
outputFormat.setCaseType(HanyuPinyinCaseType);
HanyuPinyinCaseType.LOWERCASE 转换后以全小写方式输出
HanyuPinyinCaseType.UPPERCASE 转换后以全大写方式输出
pinyin4j的jar百度网盘链接如下,在lib文件夹下。
链接: https://pan.baidu.com/s/1QR0migInWkE-McpKSlIXZg.
提取码:7l9e
二、添加pinyin4j
我们解决该问题需要它的jar包,首先添加外部类文件夹,将lib下的jar包添加进来,通过项目下的属性,然后选择Java构建路径,再点击库,添加外部JAR即可。
三、编写转换代码
根据自己认定的逻辑,编写相应的代码,因为四个字姓名以上必然为复姓,所以自己排除了两个字和三个字姓名,但也有缺陷,像诸葛亮就是特例,所以将来需要收集复姓,才能解决真正的姓和名。
此转换方法比较完善,对拼音进行了多方面判断,再返回对应的拼音。
//中文转拼音
public static String getPingYin(String inputString) {
// 创建汉语拼音处理类
HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
format.setCaseType(HanyuPinyinCaseType.LOWERCASE);// 小写
format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);// 无音标
format.setVCharType(HanyuPinyinVCharType.WITH_V);// 用v表示ü (nv)
String output = "";
if (inputString != null && inputString.length() > 0
&& !"null".equals(inputString)) {
char[] input = inputString.trim().toCharArray();
try {
for (int i = 0; i < input.length; i++) {
if (java.lang.Character.toString(input[i]).matches(
"[\\u4E00-\\u9FA5]+")) {
String[] temp = PinyinHelper.toHanyuPinyinStringArray(
input[i], format);
output += temp[0];
} else
output += java.lang.Character.toString(input[i]);
}
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
return "*";
}
return output;
}
四、结果展示
具体实现如下,这是从日志debug得出的。
参考博客和文章如下:
Java汉字转拼音pinyin4j用法详解.
022-pinyin4j工具类模板.
pinyin4j的使用.