【J2SE】提取汉字拼音首字母

  1. public class StringUtil {
  2. //  国标码和区位码转换常量
  3.   static final int GB_SP_DIFF = 160;
  4.   // 存放国标一级汉字不同读音的起始区位码
  5.   static final int[] secPosValueList = { 1601, 1637, 1833, 2078, 2274, 2302,
  6.     2433, 2594, 2787, 3106, 3212, 3472, 3635, 3722, 3730, 3858, 4027,
  7.     4086, 4390, 4558, 4684, 4925, 5249, 5600 };
  8.   // 存放国标一级汉字不同读音的起始区位码对应读音
  9.   static final char[] firstLetter = { 'a''b''c''d''e''f''g''h',
  10.     'j''k''l''m''n''o''p''q''r''s''t''w''x',
  11.     'y''z' };
  12.   // 获取一个字符串的拼音码
  13.   public static String getFirstLetter(String oriStr) {
  14.    String str = oriStr.toLowerCase();
  15.    StringBuffer buffer = new StringBuffer();
  16.    char ch;
  17.    char[] temp;
  18.    for (int i = 0; i < str.length(); i++) { // 依次处理str中每个字符
  19.     ch = str.charAt(i);
  20.     temp = new char[] { ch };
  21.     byte[] uniCode = new String(temp).getBytes();
  22.     if (uniCode[0] < 128 && uniCode[0] > 0) { // 非汉字
  23.      buffer.append(temp);
  24.     } else {
  25.      buffer.append(convert(uniCode));
  26.     }
  27.    }
  28.    return buffer.toString();
  29.   }
  30.   /**
  31.    * 获取一个汉字的拼音首字母。 GB码两个字节分别减去160,转换成10进制码组合就可以得到区位码
  32.    * 例如汉字“你”的GB码是0xC4/0xE3,分别减去0xA0(160)就是0x24/0x43
  33.    * 0x24转成10进制就是36,0x43是67,那么它的区位码就是3667,在对照表中读音为‘n’
  34.    */
  35.   static char convert(byte[] bytes) {
  36.    char result = '-';
  37.    int secPosValue = 0;
  38.    int i;
  39.    for (i = 0; i < bytes.length; i++) {
  40.     bytes[i] -= GB_SP_DIFF;
  41.    }
  42.    secPosValue = bytes[0] * 100 + bytes[1];
  43.    for (i = 0; i < 23; i++) {
  44.     if (secPosValue >= secPosValueList[i]
  45.       && secPosValue < secPosValueList[i + 1]) {
  46.      result = firstLetter[i];
  47.      break;
  48.     }
  49.    }
  50.    return result;
  51.   }
  52.   public static void main(String[] args) {
  53.    System.out.println(StringUtil.getFirstLetter("I love u"));
  54.    System.out.println(StringUtil.getFirstLetter("我爱北京天安门"));
  55.    System.out.println(StringUtil.getFirstLetter("I love 北京天安门"));
  56.   }
  57.  }
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值