pinyin4j工具类--Java 中文字符操作:排序、拼音

直接上代码吧!将汉子转化为拼音,用到“pinyin4j-2.5.0.jar”。

1、ChinaWord.java : 汉子排序

/**
 * @包名 :com.andy.汉字排序<br>
 * @文件名 :Test.java<br>
 * @类描述 :<br>
 * @作者 :Andy.wang<br>
 * @创建时间 :2013-9-3上午11:53:45<br>
 * @更改人 :<br>
 * @更改时间 :<br>
 */
package com.andy.huanzipaixu;

import java.text.Collator;
import java.util.Arrays;
import java.util.Collections;
import java.util.List;
import java.util.Locale;

/**
 * @包名 :com.andy.汉字排序<br>
 * @文件名 :ChinaWord.java<br>
 * @类描述 :汉字排序<br>
 * @作者 :Andy.wang<br>
 * @创建时间 :2013-9-3上午11:53:45<br>
 * @更改人 :<br>
 * @更改时间 :<br>
 */
public class ChinaWord {
	// 设置Java 虚拟机实例的语言环境值为"中文"
	private static final Locale china = Locale.CHINA;

	public static void main(String[] args) {
		String[] names = { "王生", "赵凡", "杨阳", "刘宏全", "刘乐乐", "Andy", "张伟翔" };
		ChinaWord.reverse(names);
		System.out.println("反转:" + Arrays.asList(names));

		ChinaWord.orderAsc(names);
		System.out.println("升序:" + Arrays.toString(names));

		ChinaWord.orderDesc(names);
		System.out.println("降序:" + Arrays.toString(names));
	}

	/**
	 * 
	 * @方法名 :orderDesc<br>
	 * @方法描述 :将字符串数组降序<br>
	 * @创建者 :Andy.wang<br>
	 * @创建时间 :2014-3-27下午05:14:21 <br>
	 * @param param :原字符串数组 返回类型
	 * 返回类型 :void
	 */
	public static void orderDesc(String[] param) {
		Arrays.sort(param, Collections
				.reverseOrder(Collator.getInstance(china)));
	}

	/**
	 * 
	 * @方法名 :orderAsc<br>
	 * @方法描述 :将字符串数组升序<br>
	 * @创建者 :Andy.wang<br>
	 * @创建时间 :2014-3-27下午05:09:50 <br>
	 * @param param
	 *            :原字符串数组 
	 * <br>
	 * 返回类型 :void
	 */
	public static void orderAsc(String[] param) {
		Arrays.sort(param, Collator.getInstance(china));
	}

	/**
	 * 
	 * @方法名 :reverse<br>
	 * @方法描述 :将字符串数组倒序<br>
	 * @创建者 :Andy.wang<br>
	 * @创建时间 :2014-3-27下午04:42:13 <br>
	 * @param param
	 *            :原字符串数组 
	 * <br>
	 * 返回类型 :void
	 */
	public static void reverse(String[] param) {
		List<String> list = Arrays.asList(param);
		Collections.reverse(list);
	}
}
测试结果:

反转:[张伟翔, Andy, 刘乐乐, 刘宏全, 杨阳, 赵凡, 王生]
升序:[Andy, 刘宏全, 刘乐乐, 王生, 杨阳, 张伟翔, 赵凡]
降序:[赵凡, 张伟翔, 杨阳, 王生, 刘乐乐, 刘宏全, Andy]

2、PinyiTest.java :将汉字转化为拼音

package com.andy.pinyi;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

/**
 * 
 * @文件名 :PinyiTest.java <br>
 * @类描述 :将汉字转化为拼音 ,需要添加一个pinyin4j-2.5.0.jar<br>
 * @作者 : Andy.wang <br>
 * @创建时间 : 2012-9-5 下午05:05:29 <br>
 * @更改人 : <br>
 * @更改时间 : <br>
 */
public class PinyiTest {
	static HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();

	static {
		/**
		 * HanyuPinyinToneType : 1、WITHOUT_TONE :无音标 2、WITH_TONE_NUMBER
		 * :将音标转化为数字 3、WITH_TONE_MARK :带音标 <br>
		 * HanyuPinyinCaseType : 1、LOWERCASE :小写 2、UPPERCASE :大写 <br>
		 * HanyuPinyinVCharType : 1、WITH_U_UNICODE :以ü表示 2、WITH_U_AND_COLON
		 * :以U和一个冒号表示该拼音 3、WITH_V :以V表示该字符
		 */
		format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
		// 设置转化后拼音字母大小写
		format.setCaseType(HanyuPinyinCaseType.LOWERCASE);
		// 设置字节的编码格式
		format.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
	}

	/**
	 * 
	 * @方法名 :pinyi<br>
	 * @方法描述 :将汉字转化为拼音<br>
	 * @创建者 :Andy.wang<br>
	 * @创建时间 :2014-3-27下午05:31:22 <br>
	 * @param param
	 *            :需转化的汉字
	 * @return 返回类型 :String
	 */
	@SuppressWarnings("deprecation")
	public static String pinyi(String param) {
		if (null == param || "".equals(param)) {
			return "";
		} else {
			try {
				return PinyinHelper.toHanyuPinyinString(param, format, " ");
			} catch (BadHanyuPinyinOutputFormatCombination e) {
				e.printStackTrace();
			}
		}
		return null;
	}

	/**
	 * 
	 * @方法名 :duoYin<br>
	 * @方法描述 :获取多音字的所有拼音<br>
	 * @创建者 :Andy.wang<br>
	 * @创建时间 :2014-3-27下午05:58:30 <br>
	 * @param c
	 *            :多音字参数
	 * @return 返回类型 :String[]
	 */
	public static String[] duoYin(char c) {
		try {
			return PinyinHelper.toHanyuPinyinStringArray(c, format);
		} catch (BadHanyuPinyinOutputFormatCombination e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		return null;
	}

	public static void main(String[] args) {
		String str = "中国程序猿,绿林好汉!";
		System.out.println(PinyiTest.pinyi(str));

		char c = '重';
		String[] cs = PinyiTest.duoYin(c);
		for (int i = 0; i < cs.length; i++) {
			System.out.println("'" + c + "'的第" + (i + 1) + "种读音是:" + cs[i]);
		}
	}
}
测试结果:

zhong guo cheng xu yuan ,lü lin hao han !
'重'的第1种读音是:zhong
'重'的第2种读音是:chong

转载于:https://my.oschina.net/andy1989/blog/213504

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
pinyin4j是一个Java库,用于将中文字符转换为拼音,并提供了一些方便的方法,如自然排序、汉字转拼音等功能。下面对pinyin4j的源码进行简单的浅析,并介绍如何使用pinyin4j中文字符进行自然排序pinyin4j的主要类是PinyinHelper,它提供了将汉字转换为拼音的方法。PinyinHelper类包含了以下方法: 1. public static String[] toHanyuPinyinStringArray(char c):将字符c转换为拼音数组。 2. public static String[] toHanyuPinyinStringArray(char c, HanyuPinyinOutputFormat outputFormat):将字符c转换为拼音数组,并指定输出格式。 3. public static String[] toHanyuPinyinStringArray(String str):将字符串str转换为拼音数组。 4. public static String[] toHanyuPinyinStringArray(String str, HanyuPinyinOutputFormat outputFormat):将字符串str转换为拼音数组,并指定输出格式。 其中HanyuPinyinOutputFormat为拼音输出格式,包含了拼音的大小写、声调等信息。 除了PinyinHelper类外,pinyin4j还提供了一个Collator类,用于对中文字符进行自然排序。Collator类的使用方法如下: 1. 创建一个Collator对象:Collator collator = Collator.getInstance(Locale.CHINA); 2. 使用Collator对象进行排序:Arrays.sort(array, collator); 其中array为需要排序的数组,collator为用于排序的Collator对象。 下面是使用pinyin4j中文字符进行自然排序的示例代码: ``` import java.util.Arrays; import java.util.Locale; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; import net.sourceforge.pinyin4j.PinyinHelper; import java.text.Collator; public class ChineseSort { public static void main(String[] args) throws BadHanyuPinyinOutputFormatCombination { String[] array = new String[]{"张三", "李四", "王五", "赵六", "田七"}; // 创建一个输出格式对象,指定拼音大小写、声调等信息 HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat(); outputFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE); outputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); outputFormat.setVCharType(null); // 使用PinyinHelper类将中文转换为拼音 for (int i = 0; i < array.length; i++) { StringBuilder sb = new StringBuilder(); for (char c : array[i].toCharArray()) { if (Character.toString(c).matches("[\\u4E00-\\u9FA5]+")) { String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(c, outputFormat); sb.append(pinyinArray[0]); } else { sb.append(Character.toString(c)); } } array[i] = sb.toString(); } // 创建一个Collator对象,用于对中文字符进行自然排序 Collator collator = Collator.getInstance(Locale.CHINA); // 使用Collator对象进行排序 Arrays.sort(array, collator); // 输出结果 for (String s : array) { System.out.println(s); } } } ``` 运行以上代码,输出结果为: ``` LISI TIANQI WANGWU ZHANSHAN ZHAOLIU ``` 可以看到,中文字符已经被转换为了对应的拼音,并且按照拼音的顺序进行排序。 总之,pinyin4j是一个非常实用的Java库,可以方便地将中文字符转换为拼音,并提供了一些方便的方法,如自然排序、汉字转拼音等功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值