Java获取字符串中汉字的首字母串

工具类代码:

import java.io.UnsupportedEncodingException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class ChineseCharToEn {

    private final static int[] li_SecPosValue = { 1601, 1637, 1833, 2078, 2274,
            2302, 2433, 2594, 2787, 3106, 3212, 3472, 3635, 3722, 3730, 3858,
            4027, 4086, 4390, 4558, 4684, 4925, 5249, 5590 };

    private final static String[] lc_FirstLetter = { "a", "b", "c", "d", "e",
            "f", "g", "h", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s",
            "t", "w", "x", "y", "z" };

    private static final Pattern PATTERN_MATCH_Cn = Pattern.compile("[\\u4e00-\\u9fa5]");

    /**
     * 取得给定汉字串的首字母串,即声母串
     * @param str 给定汉字串
     * @return 声母串
     */
    public static String getAllFirstLetter(String str) {
        if (str == null || str.trim().length() == 0) {
            return "";
        }

        String _str = "";
        for (int i = 0; i < str.length(); i++) {
            String substring = str.substring(i, i + 1);
            _str = _str + getFirstLetter(substring);
        }

        return _str;
    }

    /**
     * 取得给定字符串的第一个汉字的首字母
     * @param str 给定字符串
     * @return 第一个汉字的首字母
     */
    public static String getChineseCharacterFirstLetter(String str) {
        if (str == null || str.trim().length() == 0) {
            return "";
        }

        String firstChineseCharacter = matchCnEn(str);
        if (firstChineseCharacter == null || firstChineseCharacter.trim().length() == 0) {
            return "";
        }

        StringBuffer _str = new StringBuffer();
        for (int i = 0; i < firstChineseCharacter.length(); i++) {
            _str.append(getFirstLetter(firstChineseCharacter.substring(i, i + 1)));
        }

        return _str.toString();
    }

    /**
     * @param
     * @return
     * @Description: TODO(提取英文中文)
     */
    public static String matchCnEn(String source) {
        StringBuffer result = new StringBuffer();
        Matcher m = PATTERN_MATCH_Cn.matcher(source);
        while (m.find()) {
            String r = m.group(0);
            result.append(r);
        }
        return result.toString();
    }

    /**
     * 取得给定汉字的首字母,即声母
     * @param chinese 给定的汉字
     * @return 给定汉字的声母
     */
    public static String getFirstLetter(String chinese) {
        if (chinese == null || chinese.trim().length() == 0) {
            return "";
        }
        chinese = conversionStr(chinese, "GB2312", "ISO8859-1");

        if (chinese.length() > 1) // 判断是不是汉字
        {
            int li_SectorCode = (int) chinese.charAt(0); // 汉字区码
            int li_PositionCode = (int) chinese.charAt(1); // 汉字位码
            li_SectorCode = li_SectorCode - 160;
            li_PositionCode = li_PositionCode - 160;
            int li_SecPosCode = li_SectorCode * 100 + li_PositionCode; // 汉字区位码
            if (li_SecPosCode > 1600 && li_SecPosCode < 5590) {
                for (int i = 0; i < 23; i++) {
                    if (li_SecPosCode >= li_SecPosValue[i]
                            && li_SecPosCode < li_SecPosValue[i + 1]) {
                        chinese = lc_FirstLetter[i];
                        break;
                    }
                }
            } else // 非汉字字符,如图形符号或ASCII码
            {
                chinese = conversionStr(chinese, "ISO8859-1", "GB2312");
                chinese = chinese.substring(0, 1);
            }
        }

        return chinese;
    }

    /**
     * 字符串编码转换
     * @param str 要转换编码的字符串
     * @param charsetName 原来的编码
     * @param toCharsetName 转换后的编码
     * @return 经过编码转换后的字符串
     */
    private static String conversionStr(String str, String charsetName,String toCharsetName) {
        try {
            str = new String(str.getBytes(charsetName), toCharsetName);
        } catch (UnsupportedEncodingException ex) {
            System.out.println("字符串编码转换异常:" + ex.getMessage());
        }
        return str;
    }

    /**
     * 此工具类经过测试后再调用其中的方法
     * @param args
     */
    public static void main(String[] args) {
        System.out.println("获取拼音首字母:"+getChineseCharacterFirstLetter("!@$"));
        System.out.println("获取拼音首字母:"+getChineseCharacterFirstLetter("asdqw"));
        System.out.println("获取拼音首字母:"+getChineseCharacterFirstLetter("12352"));
        System.out.println("获取拼音首字母:"+getChineseCharacterFirstLetter("大微软"));
        System.out.println("获取拼音首字母:"+getChineseCharacterFirstLetter("as房管局"));
        System.out.println("获取拼音首字母:"+getChineseCharacterFirstLetter("12房as管^#局"));
        System.out.println("获取拼音首字母:"+getChineseCharacterFirstLetter("!%大中国南昌中大china"));

        //System.out.println("获取拼音首字母:"+getAllFirstLetter("1@#大中国南昌中大china"));
        //System.out.println("获取拼音首字母:"+getAllFirstLetter("@#大中国南昌中大china"));
    }

}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值