java pinyin4j 官网_Java中文转汉语拼音类库pinyin4j使用示例

pinyin4j的java开源类库,提供中文转汉语拼音(并且支持多音字)

pinyin4j官方网址:http://pinyin4j.sourceforge.net/

import java.util.HashSet;

import java.util.Set;

import net.sourceforge.pinyin4j.PinyinHelper;

import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;

import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;

import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;

import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;

import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

public class pinyin4j {

/**

* 字符串集合转换字符串(逗号分隔)

* @author wyh

* @param stringSet

* @return

*/

public static String makeStringByStringSet(Set stringSet){

StringBuilder str = new StringBuilder();

int i=0;

for(String s : stringSet){

if(i == stringSet.size() - 1){

str.append(s);

}else{

str.append(s + ",");

}

i++;

}

return str.toString().toLowerCase();

}

/**

* 获取拼音集合

* @author wyh

* @param src

* @return Set

*/

public static Set getPinyin(String src){

if(src!=null && !src.trim().equalsIgnoreCase("")){

char[] srcChar ;

srcChar=src.toCharArray();

//汉语拼音格式输出类

HanyuPinyinOutputFormat hanYuPinOutputFormat = new HanyuPinyinOutputFormat();

//输出设置,大小写,音标方式等

hanYuPinOutputFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);

hanYuPinOutputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE)

hanYuPinOutputFormat.setVCharType(HanyuPinyinVCharType.WITH_V);

String[][] temp = new String[src.length()][];

for(int i=0;i

char c = srcChar[i];

//是中文或者a-z或者A-Z转换拼音(我的需求,是保留中文或者a-z或者A-Z)

if(String.valueOf(c).matches("[\\u4E00-\\u9FA5]+")){

try{

temp[i] = PinyinHelper.toHanyuPinyinStringArray(srcChar[i], hanYuPinOutputFormat);

}catch(BadHanyuPinyinOutputFormatCombination e) {

e.printStackTrace();

}

}else if(((int)c>=65 && (int)c<=90) || ((int)c>=97 && (int)c<=122)){

temp[i] = new String[]{String.valueOf(srcChar[i])};

}else{

temp[i] = new String[]{""};

}

}

String[] pingyinArray = Exchange(temp);

Set pinyinSet = new HashSet();

for(int i=0;i

pinyinSet.add(pingyinArray[i]);

}

return pinyinSet;

}

return null;

}

/**

* 递归

* @author wyh

* @param strJaggedArray

* @return

*/

public static String[] Exchange(String[][] strJaggedArray){

String[][] temp = DoExchange(strJaggedArray);

return temp[0];

}

/**

* 递归

* @author wyh

* @param strJaggedArray

* @return

*/

private static String[][] DoExchange(String[][] strJaggedArray){

int len = strJaggedArray.length;

if(len >= 2){

int len1 = strJaggedArray[0].length;

int len2 = strJaggedArray[1].length;

int newlen = len1*len2;

String[] temp = new String[newlen];

int Index = 0;

for(int i=0;i

for(int j=0;j

temp[Index] = strJaggedArray[0][i] + strJaggedArray[1][j];

Index ++;

}

}

String[][] newArray = new String[len-1][];

for(int i=2;i

newArray[i-1] = strJaggedArray[i];

}

newArray[0] = temp;

return DoExchange(newArray);

}else{

return strJaggedArray;

}

}

/**

* @param args

*/

public static void main(String[] args) {

String str = "单田芳";

System.out.println(makeStringByStringSet(getPinyin(str)));

}

}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
jpinyin - A opensource java library for converting chinese to pinyin JPinyin是一个汉字拼音的Java开源类库,在PinYin4j的功能基础上做了一些改进。 【JPinyin主要特性】 1、准确、完善的字库; Unicode编码从4E00-9FA5范围及3007(〇)的20903个汉字中,JPinyin能换除46个异体字(异体字不存在标准拼音)之外的所有汉字; 2、拼音换速度快; 经测试,换Unicode编码从4E00-9FA5范围的20902个汉字,JPinyin耗时约100毫秒。 3、多拼音格式输出支持; JPinyin支持多种拼音输出格式:带音标、不带音标、数字表示音标以及拼音首字母输出格式; 4、常见多音字识别; JPinyin支持常见多音字的识别,其中包括词组、成语、地名等; 5、简繁体中文换; 6、支持添加用户自定义字典; Maven com.github.stuxuhai jpinyin 1.1.8 Gradle Step 1. Add the JitPack repository to your build file Add it in your root build.gradle at the end of repositories: allprojects { repositories { ... maven { url "https://jitpack.io" } } } Step 2. Add the dependency dependencies { compile 'com.github.SilenceDut:jpinyin:v1.0' } Usage String str = "你好世界"; PinyinHelper.convertToPinyinString(str, ",", PinyinFormat.WITH_TONE_MARK); // nǐ,hǎo,shì,jiè PinyinHelper.convertToPinyinString(str, ",", PinyinFormat.WITH_TONE_NUMBER); // ni3,hao3,shi4,jie4 PinyinHelper.convertToPinyinString(str, ",", PinyinFormat.WITHOUT_TONE); // ni,hao,shi,jie PinyinHelper.getShortPinyin(str); // nhsj PinyinHelper.addPinyinDict("user.dict"); // 添加用户自定义字典
好的,关于Java中判断汉字音调的问题,我可以给您提供一些思路和参考。 首先,Java本身并没有提供直接判断汉字音调的方法,但是通过使用第三方库可以实现这个功能。其中,pinyin4j库是一个比较常用的选择,它可以将汉字换成带音调的拼音字符串。 以下是一个使用pinyin4j库的示例代码,可以将一个汉字字符串换成带音调的拼音字符串: ```java import net.sourceforge.pinyin4j.PinyinHelper; public class TestPinyin { public static void main(String[] args) { String hanzi = "你好世界"; StringBuilder pinyin = new StringBuilder(); for (int i = 0; i < hanzi.length(); i++) { String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(hanzi.charAt(i)); if (pinyinArray != null) { pinyin.append(pinyinArray[0]); } else { pinyin.append(hanzi.charAt(i)); } } System.out.println(pinyin.toString()); } } ``` 上述代码中,我们通过遍历汉字字符串的每个字符,调用PinyinHelper类的toHanyuPinyinStringArray方法将其换成拼音字符串,并将结果拼接到StringBuilder对象中。如果该字符没有对应的拼音,则直接将其加入到结果中。 需要注意的是,pinyin4j库中的拼音字符串并不包含音调信息,而是使用数字代表不同的音调。例如,"nǐ hǎo shì jiè"中的音调分别为1、3、4、4,对应的拼音字符串为"ni3 hao3 shi4 jie4"。 如果您需要判断汉字字符串中的音调,可以在上述代码的基础上进行扩展。一种可行的思路是,通过判断每个拼音字符串中的数字来确定对应的音调。例如,以下代码可以统计汉字字符串中一共有几个一声、二声、三声和四声: ```java import net.sourceforge.pinyin4j.PinyinHelper; public class TestPinyin { public static void main(String[] args) { String hanzi = "你好世界"; StringBuilder pinyin = new StringBuilder(); int[] tones = new int[4]; // 存储四个音调的数量 for (int i = 0; i < hanzi.length(); i++) { String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(hanzi.charAt(i)); if (pinyinArray != null) { pinyin.append(pinyinArray[0]); for (int j = 0; j < pinyinArray[0].length(); j++) { char c = pinyinArray[0].charAt(j); if (c >= '1' && c <= '4') { int tone = c - '0' - 1; tones[tone]++; } } } else { pinyin.append(hanzi.charAt(i)); } } System.out.println(pinyin.toString()); System.out.println("一声:" + tones[0]); System.out.println("二声:" + tones[1]); System.out.println("三声:" + tones[2]); System.out.println("四声:" + tones[3]); } } ``` 上述代码中,我们首先定义了一个长度为4的整型数组tones,用于存储不同音调的数量。然后在遍历汉字字符串的每个字符时,将其换成拼音字符串,并统计其中的音调数量。最后输出结果时,可以根据tones数组中的数量来判断不同音调的出现次数。 希望这些提示能够对您有所帮助。如果您有其他问题,可以继续问我。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值