公司是做爬虫的,最近需要搜索中文名字的任务,需要将中文姓氏转换拼音搜索
结合pinyin4j.jar
/**
* 百家姓转换成拼音
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
ArrayList<String> nameList=StrUtil.read("E:/email_util/baijiaxing.txt");//读取百家姓
List<String> AllNameList=new ArrayList<String>();//用来保存拼音姓名
for (String string : nameList) {
char[] chars=string.trim().toCharArray();
// System.out.println(chars);
List<String> pinyinList= getName(chars);
for (String string2 : pinyinList) {
if(AllNameList.indexOf(string2)==-1){
System.out.println(string2);
AllNameList.add(string2);
}
}
}
}
/*
* 得到中文姓氏拼音
*/
private static List<String> getName(char[] chars) {
// TODO Auto-generated method stub
List<String> nameList=new ArrayList<String>();
List<String> nameListCopy=new ArrayList<String>();
boolean isFristNmae=false;//是否为姓氏第一个字
for (char c : chars) {
String[] name1=PinyinHelper.toHanyuPinyinStringArray(c);
if(name1!=null){
for (String string : name1) {
if(nameList.size()>0&&isFristNmae){
for (String lastname : nameList) {
nameListCopy.add(lastname+string.replaceAll("\\d", ""));
}
}else {
nameList.add(string.replaceAll("\\d", ""));
}
}
}
if(nameListCopy.size()>0){
nameList.clear();
nameList.addAll(nameListCopy);
nameListCopy.clear();
}
if(!isFristNmae){
isFristNmae=true;
}
}
return nameList;
}