近来有个需求是从前台输入的文本框的汉字串,到后台要将其处理成首字母的串,存放到数据库中。网上查找了方法,这里记录下来,方便查看。Java中有汉字转换为全拼的包,这里引用的是
net.sourceforge.pinyin4j.PinyinHelper
汉字提取首字母
利用**PinyinHelper.toHanyuPinyinStringArray(str)**获取汉字的首字母。提取首字母的代码如下
//引入所需要的包
import net.sourceforge.pinyin4j.PinyinHelper
//声明对象 汉字转换为全拼
//字符串
String str = "庆祝中华人民共和国七十周年";
//定义一个变量,存放计算出来首字母的串
String newStr= "";
//遍历字符串
for (int i = 0; i < str.length(); i++) {
char oneChar= str.charAt(i);
// PinyinHelperPinyinHelper的toHanyuPinyinStringArray函数来提取汉字的首字母
String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(oneChar);
if (pinyinArray != null) {
newStr+= pinyinArray[0].charAt(0);
} else {
newStr+= word;
}
}
汉字转换拼音
利用**PinyinHelper.toHanyuPinyinStringArray(str,outputFormat)**来获取汉字的全拼。
//引入包
import net.sourceforge.pinyin4j.PinyinHelper
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
//声明对象 汉字转换为全拼
HanyuPinyinOutputFormat t3 = new HanyuPinyinOutputFormat();
outputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
// 定义匹配简体和繁体的汉字的规则
String regExp="^[\u4E00-\u9FFF]+$";
//定义一个变量,存放计算出来的串
String newStr= "";
//转换的子串-汉字的全拼
String newChar= "";
//字符串
String str = "庆祝中华人民共和国七十周年";
//遍历字符串
for(int i=0;i<str.length();i++){
char oneChar=str.charAt(i);
if(match(String.valueOf(oneChar),regExp)){
//newChar 存放汉字的全拼,获取首字母可以newChar.charAt(0)
newChar = PinyinHelper.toHanyuPinyinStringArray(str,outputFormat);
//拼接最后的串
newStr += newChar ;
}
}
正则表达式主要有以下形式:
1、[\u2E80-\u9FFF]+$ 匹配所有东亚区的语言
2、[\u4E00-\u9FFF]+$ 匹配简体和繁体
3、[\u4E00-\u9FA5]+$ 匹配简体
马上就是十一国庆,在这里祝愿祖国母亲,节日快乐,祝伟大的祖国繁荣昌盛!同时感谢参考的两篇博客的作者。
博客来源:
【1】https://www.cnblogs.com/nikeodong/p/8214593.html
【2】https://www.cnblogs.com/kingsam/p/5643993.html