问题背景
正在开发一个音乐播放器的项目,有个小功能是按照曲目的名称排序曲目,原理是按照compareTo
方法去比较字符串大小,但是中文字符串排序出来是乱序的
解决过程
探索了compareTo
方法,一下子就发现问题了,如图
一般而言,中文我们是按照拼音进行排序,例如Windows
系统中的文件“按照名称排序
”就是这个原理。按理说“阿
”应该在“波
”之前,而compareTo
却给出了相反的结果
因此我们对中文排序时需要先将其转换为拼音,这里使用pinyin4j
,依赖如下
<!-- 中文转拼音 -->
<dependency>
<groupId>com.belerweb</groupId>
<artifactId>pinyin4j</artifactId>
<version>2.5.0</version>
</dependency>
使用方法: 创建HanyuPinyinOutputFormat
对象,设置中文转拼音的参数(小写
还是大写
、带不带声调
、u是否用v代替
)
private static HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
static {
// 拼音小写
format.setCaseType(HanyuPinyinCaseType.LOWERCASE);
// 不带声调
format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
// u 用 v 代替
format.setVCharType(HanyuPinyinVCharType.WITH_V);
}
然后开始写比较字符串的方法,代码如下
/**
* 比较两个字符串大小
*
* @param s1
* @param s2
* @return
*/
public static int compare(String s1, String s2) throws BadHanyuPinyinOutputFormatCombination {
for (int i = 0, len = Math.min(s1.length(), s2.length()); i < len; i++) {
char c1 = s1.charAt(i), c2 = s2.charAt(i);
// 两个字符相等,继续往后比较
if (c1 == c2) continue;
// c1 和 c2 都是中文字符,将其转换为拼音再用 compareTo 比较 ASCII 码
if ((c1 + "").matches("[\\u4E00-\\u9FA5]+") && (c2 + "").matches("[\\u4E00-\\u9FA5]+"))
return PinyinHelper.toHanyuPinyinStringArray(c1, format)[0].compareTo(PinyinHelper.toHanyuPinyinStringArray(c2, format)[0]);
// 直接比较 CodePoint
return c1 - c2;
}
return s1.length() - s2.length();
}
完美解决!