Java中如何将中文转换为英文String

在JAVA 编程中我们经常免不了需要对中文排序,而往往我们排序的依据就是中文的首字母,当然无论依据什么排序,我们都需要将中文转换成为String

首先,我们要调用一个库 pinyin4j-2.5.0.jar

下载地址:Chinese to Pinyin download | SourceForge.net

下载解压,里面有个pinyin4j-2.5.0.jar,使用这个库即可。

其次,使用这个库,使用的方法很简单,需要注意以下几点:

/ UPPERCASE:大写  (ZHONG)  
// LOWERCASE:小写  (zhong)  
format.setCaseType(HanyuPinyinCaseType.LOWERCASE);  
  
// WITHOUT_TONE:无音标  (zhong)  
// WITH_TONE_NUMBER:1-4数字表示英标  (zhong4)  
// WITH_TONE_MARK:直接用音标符(必须WITH_U_UNICODE否则异常)  (zhòng)  
format.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);  
  
// WITH_V:用v表示ü  (nv)  
// WITH_U_AND_COLON:用"u:"表示ü  (nu:)  
// WITH_U_UNICODE:直接用ü (nü)  
format.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);  

 更加直接的说,将中文转换成为String 主要是使用下面的这个接口:

    PinyinHelper.toHanyuPinyinStringArray(input[i], format);  

  这个接口有个容错判断 如果input 如果传入的不是汉字,就不能转换成拼音,那么直接返回null,所以需要用正则表达式判断是否是中文
Character.toString(input[i]).matches("[\\u4E00-\\u9FA5]+")
   
  更加具体的内容请看下面的完整代码
<pre name="code" class="java">	public static String getPinYin(String inputString) {
    	HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
    	format.setCaseType(HanyuPinyinCaseType.LOWERCASE);
    	format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
    	format.setVCharType(HanyuPinyinVCharType.WITH_V);
    	
    	char[] input = inputString.trim().toCharArray();
    	String output = "";
    	try {
    		for (int i = 0; i < input.length; i++) {
    			if (Character.toString(input[i]).matches("[\\u4E00-\\u9FA5]+")) {  //判断字符是否是中文
    				//toHanyuPinyinStringArray 如果传入的不是汉字,就不能转换成拼音,那么直接返回null
    				//由于中文有很多是多音字,所以这些字会有多个String,在这里我们默认的选择第一个作为pinyin
    				String[] temp = PinyinHelper.toHanyuPinyinStringArray(input[i], format);  
    				output += temp[0];
    			} else {
    				output += Character.toString(input[i]);
    			}
    		}
    	} catch (BadHanyuPinyinOutputFormatCombination e) {
    		e.printStackTrace();
//    		Log.v(TAG, "BadHanyuPinyinOutputFormatCombination");
    	}
    	return output;
    }
    
	/**
	 * 取出拼音中第一个字母,一般第一个字母的使用时比较常见的
	 * @param chines
	 * @return
	 */
    public static String converterToFirstSpell(String chines) {
    	String pinyinName = "";
    	char[] nameChar = chines.toCharArray();
    	HanyuPinyinOutputFormat defaulFormat = new HanyuPinyinOutputFormat();
    	defaulFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
    	defaulFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
    	defaulFormat.setVCharType(HanyuPinyinVCharType.WITH_V);
    	for (int i = 0; i < nameChar.length; i++) {
    		if (nameChar[i] > 128) {
    			try {
    				pinyinName += PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaulFormat)[0].charAt(0);  
    			} catch (BadHanyuPinyinOutputFormatCombination ex) {
    				ex.printStackTrace();
    			}
    		} else {
    			pinyinName += nameChar[i];
    		}
    	}
    	return pinyinName;
    }

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值