JAVA程序:Chinese to Pinyin 【汉字转拼音】

简介

        有个专门用来将中文转换成汉语拼音的Java的开源库,当前的版本是pinyin4j-2.5.0。详见http://sourceforge.net/projects/pinyin4j/,可以到网站上下载最新的库。

        另外此jar在git,maven上都有,对应地址是:

        https://github.com/belerweb/pinyin4j

        http://search.maven.org/#search%7Cga%7C1%7Cpinyin

缺点

        不能区分汉字的多音字,比如重庆,重大,重字有两个音:zhong4,chong2,需要调用者自己判断是取哪一个,一般情况下取第一个。

使用示例

    maven引用依赖

                <dependency>
			<groupId>com.belerweb</groupId>
			<artifactId>pinyin4j</artifactId>
			<version>2.5.0</version>
		</dependency>
  代码示例 
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

public class PinyinDemo {
	/**
	 * 将汉字转换为全拼
	 * 
	 * @param src
	 * @return String
	 */
	public static String getPinYin(String str) {
		HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();
		// 默认小写
		outputFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
		// 不显示拼音的声调
		outputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
		// outputFormat.setVCharType(HanyuPinyinVCharType.WITH_V);

		StringBuilder sb = new StringBuilder();
		try {
			for (char c : str.toCharArray()) {
				// 如果包含有中文标点除号,需要使用正则表达式
				if (Character.toString(c).matches("[\\u4E00-\\u9FA5]+")) {
					// if (c > 128) {
					sb.append(PinyinHelper.toHanyuPinyinStringArray(c,
							outputFormat)[0]);
				} else {
					sb.append(Character.toString(c));
				}
			}
		} catch (BadHanyuPinyinOutputFormatCombination e) {
			e.printStackTrace();
		}
		return sb.toString();
	}

	/**
	 * 提取每个汉字的首字母
	 * 
	 * @param str
	 * @return String
	 */
	public static String getPinYinFirstChar(String str) {
		StringBuilder sb = new StringBuilder();
		for (char c : str.toCharArray()) {
			String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(c);
			if (pinyinArray != null) {
				sb.append(pinyinArray[0].charAt(0));
			} else {
				sb.append(c);
			}
		}
		return sb.toString();
	}


	/**
	 * 将汉字转 Unicode 码
	 * 
	 * @param cnStr
	 * @return String
	 */
	public static String toUnicode(String str) {
		StringBuilder sb = new StringBuilder();
		int len = str.length();
		for (int i = 0; i < len; i++) {
			// 将每个字符转换成ASCII码
			sb.append(Integer.toHexString(str.charAt(i) & 0xffff) + "\\u");
		}
		return sb.toString();
	}

	public static void main(String[] args) {
		String str = "JAVA Chinese characters to Pinyin 俄媒:美国无法说服中国跟随制裁俄罗斯";
		System.out.println(getPinYin(str));
		System.out.println(getPinYinFirstChar(str));
		System.out.println(toUnicode("中JAVA大"));
	}

}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
jpinyin - A opensource java library for converting chinese to pinyin JPinyin是一个汉字拼音Java开源类库,在PinYin4j的功能基础上做了一些改进。 【JPinyin主要特性】 1、准确、完善的字库; Unicode编码从4E00-9FA5范围及3007(〇)的20903个汉字中,JPinyin换除46个异体字(异体字不存在标准拼音)之外的所有汉字; 2、拼音换速度快; 经测试,换Unicode编码从4E00-9FA5范围的20902个汉字,JPinyin耗时约100毫秒。 3、多拼音格式输出支持; JPinyin支持多种拼音输出格式:带音标、不带音标、数字表示音标以及拼音首字母输出格式; 4、常见多音字识别; JPinyin支持常见多音字的识别,其中包括词组、成语、地名等; 5、简繁体中文换; 6、支持添加用户自定义字典; Maven com.github.stuxuhai jpinyin 1.1.8 Gradle Step 1. Add the JitPack repository to your build file Add it in your root build.gradle at the end of repositories: allprojects { repositories { ... maven { url "https://jitpack.io" } } } Step 2. Add the dependency dependencies { compile 'com.github.SilenceDut:jpinyin:v1.0' } Usage String str = "你好世界"; PinyinHelper.convertToPinyinString(str, ",", PinyinFormat.WITH_TONE_MARK); // nǐ,hǎo,shì,jiè PinyinHelper.convertToPinyinString(str, ",", PinyinFormat.WITH_TONE_NUMBER); // ni3,hao3,shi4,jie4 PinyinHelper.convertToPinyinString(str, ",", PinyinFormat.WITHOUT_TONE); // ni,hao,shi,jie PinyinHelper.getShortPinyin(str); // nhsj PinyinHelper.addPinyinDict("user.dict"); // 添加用户自定义字典

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值