背景:
之前一直是前端直接调用公司公共城市组件获取城市列表,现在由于公共组件不再支持,需要由后端接口提供城市查询,并且按照城市首字母分组展示。
后端实现:
最开始选择pinyin4j来实现,但发现对多音字的处理不太友好,比如需要转重庆的拼音(可以看到结果并不是我们想要的):
解决方法就需要自己定义多音字字典来实现,解析这个文件优先从这个文件中获取拼音,类似如下文件(字典格式可自行定义):
以上自己定义字典的方式比较麻烦,经过在网上的一顿搜索,发现可以使用具有语义的依赖包(底层也是用的自定义字典实现):
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.8.3</version>
</dependency>
复制代码
在项目中定义一个工具类:
public class PinyinUtil {
/**
* 获取中文完整拼音
*
* @param chineseStr
* @return
*/
public static String getPinyin(String chineseStr) {
List<Pinyin> pinyins = PinyinDictionary.convertToPinyin(chineseStr);
StringBuilder stringBuilder = new StringBuilder();
for (Pinyin pinyin : pinyins) {
stringBuilder.append(pinyin.getPinyinWithoutTone());
}
return stringBuilder.toString();
}
/**
* 获取中文拼音首字母
*
* @param chineseStr
* @return
*/
public static String getInitial(String chineseStr) {
List<Pinyin> pinyins = PinyinDictionary.convertToPinyin(chineseStr);
if (CollectionUtils.isEmpty(pinyins)) {
return StringUtils.EMPTY;
}
return String.valueOf(pinyins.get(0).getPinyinWithoutTone().charAt(0));
}
}
复制代码
结果演示:
更多方法使用:
好了,到此结束。简单直接,没有一个字是多余的。😄