有个项目需要用到生成汉字的首字母,但从网上查了一下,对于多音字的处理都不是很好,所以就利用pinyin4j这个工具包自己写了一个。用到的jar包是pinyin4j-2.5.0.jar
//获取拼音首字母,多音字用逗号隔开
public static String getFirstSpell(String chinese) throws Exception{
//用户存储每个字符的首字母
String [] firstSpells=new String[chinese.length()];
List<String> list=new ArrayList<String>();
for(int i=0;i<firstSpells.length;i++){
//如果是汉字获取其首字母,如果不是汉字,原字符显示
if(String.valueOf(chinese.charAt(i)).matches("[\\u4E00-\\u9FA5]+")){
firstSpells[i]=getFirstCharacter(chinese.charAt(i));
}else{
firstSpells[i]=String.valueOf(chinese.charAt(i));
}
}
for(String fs:firstSpells){
List<String> newlist=new ArrayList<String>();
if(list.size() == 0){
for(char ca:fs.toCharArray()){
newlist.add(String.valueOf(ca));
}
}else{
for(String sa:list){
for(char ca:fs.toCharArray()){
newlist.add(sa+String.valueOf(ca));
}
}
}
list=newlist;
}
String str="";
for(String sin:list){
str+=sin+",";
}
return str.substring(0, str.length()-1).toUpperCase();
}
//获取单个汉字的所有可能读音的首字母串
public static String getFirstCharacter(char c)throws Exception{
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
//用pinyin4j工具包获取汉字的全拼(可能是多音字)
String[] quanpin= PinyinHelper.toHanyuPinyinStringArray(c, defaultFormat);
String allFirstCharacterStr="";
Set<String> allFirstCharacterSet=new HashSet<String>();
//把首字母放到set中,利用set的特性防止多音字中首字母有重复的
for(String str:quanpin){
allFirstCharacterSet.add(str.substring(0,1));
}
//把首字母拼成字符串
for(String s:allFirstCharacterSet){
allFirstCharacterStr+=s;
}
return allFirstCharacterStr;
}
public static void main(String[] args) throws BadHanyuPinyinOutputFormatCombination {
try {
System.out.println(getFirstSpell("人参a"));
} catch (Exception e) {
e.printStackTrace();
}
}
测试代码的执行结果:RSA,RCA
代码没有经过详细的测试,其中可能会有bug,仅供参考