汉字转全拼

不太推荐,毕竟代码里面写拼音太low~~~不过还是贴出来,万一要用了^ ^

import java.io.UnsupportedEncodingException;
import java.util.Collections;
import java.util.Iterator;
import java.util.LinkedHashMap;
import java.util.Map;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * 将汉字转化为全拼 
 * 判断字符编码
 */
public class ChineseUtils {

    private static Map<String, Integer> spellMap = null;
    // 存放生僻字和其拼音的Map
    private static Map<Character, String> uncommonWordsMap = null;

    private static ChineseUtils instance=null;
    public static ChineseUtils getInstance(){
        if(instance==null){
            instance=new ChineseUtils();
        }
        return instance;

    }
    static {
        if (spellMap == null) {
            spellMap = Collections
                    .synchronizedMap(new LinkedHashMap<String, Integer>(396));
            uncommonWordsMap = Collections
                    .synchronizedMap(new LinkedHashMap<Character, String>(200));
        }
        initialize();
        initUncommonWords();
    }
    public ChineseUtils() {

    }
    /**
     * 设置中文转拼音 
     * @param string
     * false 全拼  true首拼
     * @return
     */
    public String SetChineseToEnglish(String string){
        String newstring="";
        try {
            newstring=new String(string.getBytes("UTF-8"), "GB2312");
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
        return getSpell(string,false);

    }
    /**
     * 判断字符编码
     * @param str
     * @return
     */
    public static String getEncoding(String str) {      
        String encode = "GB2312";      
        try {      
            if (str.equals(new String(str.getBytes(encode), encode))) {      
                String s = encode;      
                return s;      
            }      
        } catch (Exception exception) {      
        }      
        encode = "ISO-8859-1";      
        try {      
            if (str.equals(new String(str.getBytes(encode), encode))) {      
                String s1 = encode;      
                return s1;      
            }      
        } catch (Exception exception1) {      
        }      
        encode = "UTF-8";      
        try {      
            if (str.equals(new String(str.getBytes(encode), encode))) {      
                String s2 = encode;      
                return s2;      
            }      
        } catch (Exception exception2) {      
        }      
        encode = "GBK";      
        try {      
            if (str.equals(new String(str.getBytes(encode), encode))) {      
                String s3 = encode;      
                return s3;      
            }      
        } catch (Exception exception3) {      
        }      
        return "";      
    }  
    /**
     * 初始化
     */
    private static void initialize() {
        spellMap.put("’a", -20319);
        spellMap.put("’ai", -20317);
        spellMap.put("’an", -20304);
        spellMap.put("’ang", -20295);
        spellMap.put("’ao", -20292);
        spellMap.put("ba", -20283);
        spellMap.put("bai", -20265);
        spellMap.put("ban", -20257);
        spellMap.put("bang", -20242);
        spellMap.put("bao", -20230);
        spellMap.put("bei", -20051);
        spellMap.put("ben", -20036);
        spellMap.put("beng", -20032);
        spellMap.put("bi", -20026);
        spellMap.put("bian", -20002);
        spellMap.put("biao", -19990);
        spellMap.put("bie", -19986);
        spellMap.put("bin", -19982);
        spellMap.put("bing", -19976);
        spellMap.put("bo", -19805);
        spellMap.put("bu", -19784);
        spellMap.put("ca", -19775);
        spellMap.put("cai", -19774);
        spellMap.put("can", -19763);
        spellMap.put("cang", -19756);
        spellMap.put("cao", -19751);
        spellMap.put("ce", -19746);
        spellMap.put("ceng", -19741);
        spellMap.put("cha", -19739);
        spellMap.put("chai", -19728);
        spellMap.put("chan", -19725);
        spellMap.put("chang", -19715);
        spellMap.put("chao", -19540);
        spellMap.put("che", -19531);
        spellMap.put("chen", -19525);
        spellMap.put("cheng", -19515);
        spellMap.put("chi", -19500);
        spellMap.put("chong", -19484);
        spellMap.put("chou", -19479);
        spellMap.put("chu", -19467);
        spellMap.put("chuai", -19289);
        spellMap.put("chuan", -19288);
        spellMap.put("chuang", -19281);
        spellMap.put("chui", -19275);
        spellMap.put("chun", -19270);
        spellMap.put("chuo", -19263);
        spellMap.put("ci", -19261);
        spellMap.put("cong", -19249);
        spellMap.put("cou", -19243);
        spellMap.put("cu", -19242);
        spellMap.put("cuan", -19238);
        spellMap.put("cui", -19235);
        spellMap.put("cun", -19227);
        spellMap.put("cuo", -19224);
        spellMap.put("da", -19218);
        spellMap.put("dai", -19212);
        spellMap.put("dan", -19038);
        spellMap.put("dang", -19023);
        spellMap.put("dao", -19018);
        spellMap.put("de", -19006);
        spellMap.put("deng", -19003);
        spellMap.put("di", -18996);
        spellMap.put("dian", -18977);
        spellMap.put("diao", -18961);
        spellMap.put("die", -18952);
        spellMap.put("ding", -18783);
        spellMap.put("diu", -18774);
        spellMap.put("dong", -18773);
        spellMap.put("dou", -18763);
        spellMap.put("du", -18756);
        spellMap.put("duan", -18741);
        spellMap.put("dui", -18735);
        spellMap.put("dun", -18731);
        spellMap.put("duo", -18722);
        spellMap.put("’e", -18710);
        spellMap.put("’en", -18697);
        spellMap.put("’er", -18696);
        spellMap.put("fa", -18526);
        spellMap.put("fan", -18518);
        spellMap.put("fang", -18501);
        spellMap.put("fei", -18490);
        spellMap.put("fen", -18478);
        spellMap.put("feng", -18463);
        spellMap.put("fo", -18448);
        spellMap.put("fou", -18447);
        spellMap.put("fu", -18446);
        spellMap.put("ga", -18239);
        spellMap.put("gai", -18237);
        spellMap.put("gan", -18231);
        spellMap.put("gang", -18220);
        spellMap.put("gao", -18211);
        spellMap.put("ge", -18201);
        spellMap.put("gei", -18184);
        spellMap.put("gen", -18183);
        spellMap.put("geng", -18181);
        spellMap.put("gong", -18012);
        spellMap.put("gou", -17997);
        spellMap.put("gu", -17988);
        spellMap.put("gua", -17970);
        spellMap.put("guai", -17964);
        spellMap.put("guan", -17961);
        spellMap.put("guang", -17950);
        spellMap.put("gui", -17947);
        spellMap.put("gun", -17931);
        spellMap.put("guo", -17928);
        spellMap.put("ha", -17922);
        spellMap.put("hai", -17759);
        spellMap.put("han", -17752);
        spellMap.put("hang", -17733);
        spellMap.put("hao", -17730);
        spellMap.put("he", -17721);
        spellMap.put("hei", -17703);
        spellMap.put("hen", -17701);
        spellMap.put("heng", -17697);
        spellMap.put("hong", -17692);
        spellMap.put("hou", -17683);
        spellMap.put("hu", -17676);
        spellMap.put("hua", -17496);
        spellMap.put("huai", -17487);
        spellMap.put("huan", -17482);
        spellMap.put("huang", -17468);
        spellMap.put("hui", -17454);
        spellMap.put("hun", -17433);
        spellMap.put("huo", -17427);
        spellMap.put("ji", -17417);
        spellMap.put("jia", -17202);
        spellMap.put("jian", -17185);
        spellMap.put("jiang", -16983);
        spellMap.put("jiao", -16970);
        spellMap.put("jie", -16942);
        spellMap.put("jin", -16915);
        spellMap.put("jing", -16733);
        spellMap.put("jiong", -16708);
        spellMap.put("jiu", -16706);
        spellMap.put("ju", -16689);
        spellMap.put("juan", -16664);
        spellMap.put("jue", -16657);
        spellMap.put("jun", -16647);
        spellMap.put("ka", -16474);
        spellMap.put("kai", -16470);
        spellMap.put("kan", -16465);
        spellMap.put("kang", -16459);
        spellMap.put("kao", -16452);
        spellMap.put("ke", -16448);
        spellMap.put("ken", -16433);
        spellMap.put("keng", -16429);
        spellMap.put("kong", -16427);
        spellMap.put("kou", -16423);
        spellMap.put("ku", -16419);
        spellMap.put("kua", -16412);
        spellMap.put("kuai", -16407);
        spellMap.put("kuan", -16403);
        spellMap.put("kuang", -16401);
        spellMap.put("kui", -16393);
        spellMap.put("kun", -16220);
        spellMap.put("kuo", -16216);
        spellMap.put("la", -16212);
        spellMap.put("lai", -16205);
        spellMap.put("lan", -16202);
        spellMap.put("lang", -16187);
        spellMap.put("lao", -16180);
        spellMap.put("le", -16171);
        spellMap.put("lei", -16169);
        spellMap.put("leng", -16158);
        spellMap.put("li", -16155);
        spellMap.put("lia", -15959);
        spellMap.put("lian", -15958);
        spellMap.put("liang", -15944);
        spellMap.put("liao", -15933);
        spellMap.put("lie", -15920);
        spellMap.put("lin", -15915);
        spellMap.put("ling", -15903);
        spellMap.put("liu", -15889);
        spellMap.put("long", -15878);
        spellMap.put("lou", -15707);
        spellMap.put("lu", -15701);
        spellMap.put("lv", -15681);
        spellMap.put("luan", -15667);
        spellMap.put("lue", -15661);
        spellMap.put("lun", -15659);
        spellMap.put("luo", -15652);
        spellMap.put("ma", -15640);
        spellMap.put("mai", -15631);
        spellMap.put("man", -15625);
        spellMap.put("mang", -15454);
        spellMap.put("mao", -15448);
        spellMap.put("me", -15436);
        spellMap.put("mei", -15435);
        spellMap.put("men", -15419);
        spellMap.put("meng", -15416);
        spellMap.put("mi", -15408);
        spellMap.put("mian", -15394);
        spellMap.put("miao", -15385);
        spellMap.put("mie", -15377);
        spellMap.put("min", -15375);
        spellMap.put("ming", -15369);
        spellMap.put("miu", -15363);
        spellMap.put("mo", -15362);
        spellMap.put("mou", -15183);
        spellMap.put("mu", -15180);
        spellMap.put("na", -15165);
        spellMap.put("nai", -15158);
        spellMap.put("nan", -15153);
        spellMap.put("nang", -15150);
        spellMap.put("nao", -15149);
        spellMap.put("ne", -15144);
        spellMap.put("nei", -15143);
        spellMap.put("nen", -15141);
        spellMap.put("neng", -15140);
        spellMap.put("ni", -15139);
        spellMap.put("nian", -15128);
        spellMap.put("niang", -15121);
        spellMap.put("niao", -15119);
        spellMap.put("nie", -15117);
        spellMap.put("nin", -15110);
        spellMap.put("ning", -15109);
        spellMap.put("niu", -14941);
        spellMap.put("nong", -14937);
        spellMap.put("nu", -14933);
        spellMap.put("nv", -14930);
        spellMap.put("nuan", -14929);
        spellMap.put("nue", -14928);
        spellMap.put("nuo", -14926);
        spellMap.put("’o", -14922);
        spellMap.put("’ou", -14921);
        spellMap.put("pa", -14914);
        spellMap.put("pai", -14908);
        spellMap.put("pan", -14902);
        spellMap.put("pang", -14894);
        spellMap.put("pao", -14889);
        spellMap.put("pei", -14882);
        spellMap.put("pen", -14873);
        spellMap.put("peng", -14871);
        spellMap.put("pi", -14857);
        spellMap.put("pian", -14678);
        spellMap.put("piao", -14674);
        spellMap.put("pie", -14670);
        spellMap.put("pin", -14668);
        spellMap.put("ping", -14663);
        spellMap.put("po", -14654);
        spellMap.put("pu", -14645);
        spellMap.put("qi", -14630);
        spellMap.put("qia", -14594);
        spellMap.put("qian", -14429);
        spellMap.put("qiang", -14407);
        spellMap.put("qiao", -14399);
        spellMap.put("qie", -14384);
        spellMap.put("qin", -14379);
        spellMap.put("qing", -14368);
        spellMap.put("qiong", -14355);
        spellMap.put("qiu", -14353);
        spellMap.put("qu", -14345);
        spellMap.put("quan", -14170);
        spellMap.put("que", -14159);
        spellMap.put("qun", -14151);
        spellMap.put("ran", -14149);
        spellMap.put("rang", -14145);
        spellMap.put("rao", -14140);
        spellMap.put("re", -14137);
        spellMap.put("ren", -14135);
        spellMap.put("reng", -14125);
        spellMap.put("ri", -14123);
        spellMap.put("rong", -14122);
        spellMap.put("rou", -14112);
        spellMap.put("ru", -14109);
        spellMap.put("ruan", -14099);
        spellMap.put("rui", -14097);
        spellMap.put("run", -14094);
        spellMap.put("ruo", -14092);
        spellMap.put("sa", -14090);
        spellMap.put("sai", -14087);
        spellMap.put("san", -14083);
        spellMap.put("sang", -13917);
        spellMap.put("sao", -13914);
        spellMap.put("se", -13910);
        spellMap.put("sen", -13907);
        spellMap.put("seng", -13906);
        spellMap.put("sha", -13905);
        spellMap.put("shai", -13896);
        spellMap.put("shan", -13894);
        spellMap.put("shang", -13878);
        spellMap.put("shao", -13870);
        spellMap.put("she", -13859);
        spellMap.put("shen", -13847);
        spellMap.put("sheng", -13831);
        spellMap.put("shi", -13658);
        spellMap.put("shou", -13611);
        spellMap.put("shu", -13601);
        spellMap.put("shua", -13406);
        spellMap.put("shuai", -13404);
        spellMap.put("shuan", -13400);
        spellMap.put("shuang", -13398);
        spellMap.put("shui", -13395);
        spellMap.put("shun", -13391);
        spellMap.put("shuo", -13387);
        spellMap.put("si", -13383);
        spellMap.put("song", -13367);
        spellMap.put("sou", -13359);
        spellMap.put("su", -13356);
        spellMap.put("suan", -13343);
        spellMap.put("sui", -13340);
        spellMap.put("sun", -13329);
        spellMap.put("suo", -13326);
        spellMap.put("ta", -13318);
        spellMap.put("tai", -13147);
        spellMap.put("tan", -13138);
        spellMap.put("tang", -13120);
        spellMap.put("tao", -13107);
        spellMap.put("te", -13096);
        spellMap.put("teng", -13095);
        spellMap.put("ti", -13091);
        spellMap.put("tian", -13076);
        spellMap.put("tiao", -13068);
        spellMap.put("tie", -13063);
        spellMap.put("ting", -13060);
        spellMap.put("tong", -12888);
        spellMap.put("tou", -12875);
        spellMap.put("tu", -12871);
        spellMap.put("tuan", -12860);
        spellMap.put("tui", -12858);
        spellMap.put("tun", -12852);
        spellMap.put("tuo", -12849);
        spellMap.put("wa", -12838);
        spellMap.put("wai", -12831);
        spellMap.put("wan", -12829);
        spellMap.put("wang", -12812);
        spellMap.put("wei", -12802);
        spellMap.put("wen", -12607);
        spellMap.put("weng", -12597);
        spellMap.put("wo", -12594);
        spellMap.put("wu", -12585);
        spellMap.put("xi", -12556);
        spellMap.put("xia", -12359);
        spellMap.put("xian", -12346);
        spellMap.put("xiang", -12320);
        spellMap.put("xiao", -12300);
        spellMap.put("xie", -12120);
        spellMap.put("xin", -12099);
        spellMap.put("xing", -12089);
        spellMap.put("xiong", -12074);
        spellMap.put("xiu", -12067);
        spellMap.put("xu", -12058);
        spellMap.put("xuan", -12039);
        spellMap.put("xue", -11867);
        spellMap.put("xun", -11861);
        spellMap.put("ya", -11847);
        spellMap.put("yan", -11831);
        spellMap.put("yang", -11798);
        spellMap.put("yao", -11781);
        spellMap.put("ye", -11604);
        spellMap.put("yi", -11589);
        spellMap.put("yin", -11536);
        spellMap.put("ying", -11358);
        spellMap.put("yo", -11340);
        spellMap.put("yong", -11339);
        spellMap.put("you", -11324);
        spellMap.put("yu", -11303);
        spellMap.put("yuan", -11097);
        spellMap.put("yue", -11077);
        spellMap.put("yun", -11067);
        spellMap.put("za", -11055);
        spellMap.put("zai", -11052);
        spellMap.put("zan", -11045);
        spellMap.put("zang", -11041);
        spellMap.put("zao", -11038);
        spellMap.put("ze", -11024);
        spellMap.put("zei", -11020);
        spellMap.put("zen", -11019);
        spellMap.put("zeng", -11018);
        spellMap.put("zha", -11014);
        spellMap.put("zhai", -10838);
        spellMap.put("zhan", -10832);
        spellMap.put("zhang", -10815);
        spellMap.put("zhao", -10800);
        spellMap.put("zhe", -10790);
        spellMap.put("zhen", -10780);
        spellMap.put("zheng", -10764);
        spellMap.put("zhi", -10587);
        spellMap.put("zhong", -10544);
        spellMap.put("zhou", -10533);
        spellMap.put("zhu", -10519);
        spellMap.put("zhua", -10331);
        spellMap.put("zhuai", -10329);
        spellMap.put("zhuan", -10328);
        spellMap.put("zhuang", -10322);
        spellMap.put("zhui", -10315);
        spellMap.put("zhun", -10309);
        spellMap.put("zhuo", -10307);
        spellMap.put("zi", -10296);
        spellMap.put("zong", -10281);
        spellMap.put("zou", -10274);
        spellMap.put("zu", -10270);
        spellMap.put("zuan", -10262);
        spellMap.put("zui", -10260);
        spellMap.put("zun", -10256);
        spellMap.put("zuo", -10254);
    }

    /**
     * 添加生僻字
     * 
     * @param cnWord
     *            生僻字
     * @param spell
     *            生僻字的拼音, 如果拼音以 a, o ,e 开头, 请将开头分别改为 ’a, ’o, ’e, 如:安(’an)
     */
    private static void putUncommonWord(char cnWord, String spell) {
        uncommonWordsMap.put(cnWord, spell);
    }

    /**
     * 初始化生僻字
     */
    private static void initUncommonWords() {
        putUncommonWord('奡', "ao");
        putUncommonWord('灞', "ba");
        putUncommonWord('犇', "ben");
        putUncommonWord('猋', "biao");
        putUncommonWord('骉', "biao");
        putUncommonWord('杈', "cha");
        putUncommonWord('棽', "chen");
        putUncommonWord('琤', "cheng");
        putUncommonWord('魑', "chi");
        putUncommonWord('蟲', "chong");
        putUncommonWord('翀', "chong");
        putUncommonWord('麤', "cu");
        putUncommonWord('毳', "cui");
        putUncommonWord('昉', "fang");
        putUncommonWord('沣', "feng");
        putUncommonWord('玽', "gou");
        putUncommonWord('焓', "han");
        putUncommonWord('琀', "han");
        putUncommonWord('晗', "han");
        putUncommonWord('浛', "han");
        putUncommonWord('翮', "he");
        putUncommonWord('翯', "he");
        putUncommonWord('嬛', "huan");
        putUncommonWord('翙', "hui");
        putUncommonWord('劼', "jie");
        putUncommonWord('璟', "jing");
        putUncommonWord('誩', "jing");
        putUncommonWord('競', "jing");
        putUncommonWord('焜', "kun");
        putUncommonWord('琨', "kun");
        putUncommonWord('鹍', "kun");
        putUncommonWord('骊', "li");
        putUncommonWord('鎏', "liu");
        putUncommonWord('嫚', "man");
        putUncommonWord('槑', "mei");
        putUncommonWord('淼', "miao");
        putUncommonWord('婻', "nan");
        putUncommonWord('暔', "nan");
        putUncommonWord('甯', "ning");
        putUncommonWord('寗', "ning");
        putUncommonWord('掱', "pa");
        putUncommonWord('玭', "pi");
        putUncommonWord('汧', "qian");
        putUncommonWord('骎', "qin");
        putUncommonWord('甠', "qing");
        putUncommonWord('暒', "qing");
        putUncommonWord('凊', "qing");
        putUncommonWord('郬', "qing");
        putUncommonWord('靘', "qing");
        putUncommonWord('悫', "que");
        putUncommonWord('慤', "que");
        putUncommonWord('瑢', "rong");
        putUncommonWord('珅', "shen");
        putUncommonWord('屾', "shen");
        putUncommonWord('燊', "shen");
        putUncommonWord('焺', "sheng");
        putUncommonWord('珄', "sheng");
        putUncommonWord('晟', "sheng");
        putUncommonWord('昇', "sheng");
        putUncommonWord('眚', "sheng");
        putUncommonWord('湦', "sheng");
        putUncommonWord('陹', "sheng");
        putUncommonWord('竔', "sheng");
        putUncommonWord('琞', "sheng");
        putUncommonWord('湜', "shi");
        putUncommonWord('甦', "su");
        putUncommonWord('弢', "tao");
        putUncommonWord('瑱', "tian");
        putUncommonWord('仝', "tong");
        putUncommonWord('烓', "wei");
        putUncommonWord('炜', "wei");
        putUncommonWord('玮', "wei");
        putUncommonWord('沕', "wu");
        putUncommonWord('邬', "wu");
        putUncommonWord('晞', "xi");
        putUncommonWord('顕', "xian");
        putUncommonWord('婋', "xiao");
        putUncommonWord('虓', "xiao");
        putUncommonWord('筱', "xiao");
        putUncommonWord('勰', "xie");
        putUncommonWord('忻', "xin");
        putUncommonWord('庥', "xiu");
        putUncommonWord('媭', "xu");
        putUncommonWord('珝', "xu");
        putUncommonWord('昫', "xu");
        putUncommonWord('烜', "xuan");
        putUncommonWord('煊', "xuan");
        putUncommonWord('翾', "xuan");
        putUncommonWord('昍', "xuan");
        putUncommonWord('暄', "xuan");
        putUncommonWord('娅', "ya");
        putUncommonWord('琰', "yan");
        putUncommonWord('妍', "yan");
        putUncommonWord('焱', "yan");
        putUncommonWord('玚', "yang");
        putUncommonWord('旸', "yang");
        putUncommonWord('飏', "yang");
        putUncommonWord('垚', "yao");
        putUncommonWord('峣', "yao");
        putUncommonWord('怡', "yi");
        putUncommonWord('燚', "yi");
        putUncommonWord('晹', "yi");
        putUncommonWord('祎', "yi");
        putUncommonWord('瑛', "ying");
        putUncommonWord('煐', "ying");
        putUncommonWord('媖', "ying");
        putUncommonWord('暎', "ying");
        putUncommonWord('滢', "ying");
        putUncommonWord('锳', "ying");
        putUncommonWord('莜', "you");
        putUncommonWord('昱', "yu");
        putUncommonWord('沄', "yun");
        putUncommonWord('晢', "zhe");
        putUncommonWord('喆', "zhe");
        putUncommonWord('臸', "zhi");
    }

    /**
     * 获得单个汉字的Ascii.
     * 
     * @param cn
     *            汉字字符
     * @return 汉字对应的 ascii, 错误时返回 0
     */
    private int getCnAscii(char cn) {
        byte[] bytes = (String.valueOf(cn)).getBytes();
        if (bytes == null || bytes.length == 0 || bytes.length >2) { // 错误
            return 0;
        }
        if (bytes.length == 1) { // 英文字符
            return bytes[0];
        }
        if (bytes.length == 2) { // 中文字符
            int hightByte = 256 + bytes[0];
            int lowByte = 256 + bytes[1];
            return (256 * hightByte + lowByte) - 256 * 256; // 返回 ASCII
        }
        return 0; // 错误
    }

    /**
     * 根据ASCII码到SpellMap中查找对应的拼音
     * 
     * @param ascii
     *            ASCII
     * @return ascii对应的拼音, 如果ascii对应的字符为单字符,则返回对应的单字符, 如果不是单字符且在 spellMap
     *         中没找到对应的拼音,则返回空字符串(""),
     */
    private static String getSpellByAscii(int ascii) {
        if (ascii > 0 && ascii < 160) { // 单字符
            return String.valueOf((char) ascii);
        }

        if (ascii < -20319 || ascii > -10247) { // 不知道的字符
            return "";
        }

        String spell = null; // key
        Integer asciiRang; // value
        String spellPrevious = null; // 用来保存上次轮循环的key
        int asciiRangPrevious = -20319; // 用来保存上一次循环的value
        for (Iterator it = spellMap.keySet().iterator(); it.hasNext();) {
            spell = (String) it.next(); // 拼音
            asciiRang = spellMap.get(spell); // 拼音的ASCII
            if (asciiRang != null) {
                if (ascii >= asciiRangPrevious && ascii < asciiRang) { // 区间找到,
                    // 返回对应的拼音
                    return (spellPrevious == null) ? spell : spellPrevious;
                } else {
                    spellPrevious = spell;
                    asciiRangPrevious = asciiRang;
                }
            }
        }
        return "";
    }

    /**
     * 获取字符串的全拼或首拼,是汉字则转化为对应的拼音或拼音首字母,其它字符不进行转换
     * 
     * @param cnStr
     *            要获取全拼或首拼的字符串
     * @param onlyFirstSpell
     *            是否只获取首拼,为true时,只获取首拼,为false时,获取全拼
     * @return String cnStr的全拼或首拼, 如果 cnStr 为null 时, 返回""
     */
    private  String getSpell(String cnStr, boolean onlyFirstSpell) {
        if (cnStr == null) {
            return "";
        }
        char[] chars = cnStr.trim().toCharArray();
        StringBuffer sb = new StringBuffer();
        for (int i = 0, len = chars.length; i < len; i++) {
            if(isChinese(String.valueOf(chars[i]))) {
                int ascii = getCnAscii(chars[i]);
                if (ascii == 0) { // 如果获取汉字的ASCII出错,则不进行转换
                    sb.append(chars[i]);
                } else {
                    String spell = getSpellByAscii(ascii); // 根据ASCII取拼音
                    if (spell == null || spell.length() == 0) { // 如果根据ASCII取拼音没取到,则到生僻字Map中取
                        spell = uncommonWordsMap.get(chars[i]);
                    }

                    if (spell == null || spell.length() == 0) { // 如果没有取到对应的拼音,则不做转换,追加原字符
                        spell = uncommonWordsMap.get(chars[i]);
                    } else {
                        if (onlyFirstSpell) {
                            if(spell.startsWith("’")) {
                                if(spell.charAt(1) == 'h') {
                                    sb.append(spell.substring(1, 3));
                                }else {
                                    sb.append(spell.substring(1, 2));
                                }
                            }else {
                                if(spell.charAt(1) == 'h') {
                                    sb.append(spell.substring(0, 2));
                                }else {
                                    sb.append(spell.substring(0, 1));
                                }
                            }
                        } else {
                            sb.append(spell);
                        }
                    }
                }
            }else {
                sb.append(chars[i]);
            }
        }
        return sb.toString();
    }
    private  boolean isChinese(String str) {
        String regEx = "[\\u4e00-\\u9fa5]";
        Pattern p = Pattern.compile(regEx);
        Matcher m = p.matcher(str);
        if (m.find()) {
            return true;
        } else {
            return false;
        }
    }
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: getpy()函数是一种将汉字化为全拼拼音的代码函数。在使用该函数之前,需要先定义一个汉字字符集字典,以便将汉字化为拼音。在该字典中,每个汉字对应一个拼音字符串列表,其中每个字符串都是该汉字的一个拼音。 具体代码实现是,首先将输入的汉字字符串逐个字符分离出来,并在定义的汉字字符集字典中查找该字符对应的拼音列表。对于每个汉字字符,将其对应的拼音字符串列表的第一个拼音添加到一个列表中,直到遍历完整个字符串。最后,将列表中所有拼音字符串按照汉字顺序合并起来,就得到了输入字符串的全拼拼音字符串。 需要注意的是,在汉字字符集字典中,一些汉字可能存在多音字情况,即一个汉字对应多个拼音字符串。在这种情况下,根据需要选择一个默认的拼音字符串或者提供选项让用户进行选择。此外,汉字中还存在一些生僻字或繁体字,这些字符在字典中可能不存在或者没有完整的拼音列表,需要进行特殊处理。 总之,getpy()函数实现了将汉字化为全拼拼音的过程,为汉字在计算机程序中的使用提供了方便和便捷。 ### 回答2: getpy函数的作用是将输入的中文字符串化为对应的全拼拼音字符串。下面是getpy函数的代码实现: ```python import pypinyin def getpy(input_str): """ 将中文化为拼音 """ # 将字符串化为列表 input_list = list(input_str) # 使用pypinyin库将中文化为拼音 pinyin_list = pypinyin.lazy_pinyin(input_list) # 使用join函数将拼音列表合并为字符串 py_str = ''.join(pinyin_list) return py_str ``` 该函数使用了pypinyin库来实现中文到拼音的换。在函数中,首先将输入的中文字符串化为一个列表,然后使用pypinyin的lazy_pinyin函数将每个汉字化为对应的拼音,得到一个拼音列表。最后,使用join函数将拼音列表合并为一个字符串并返回。 例如,当输入中文字符串“你好世界”时,函数会返回“nihao shijie”的拼音字符串。需要注意的是,该函数只能将汉字化为拼音,对于字符串中的其他字符,函数会原样保留。 ### 回答3: getpy函数是一个将中文字符串换成全拼字符串的函数。以下是getpy函数的示例代码: ```python # -*- coding: utf-8 -*- import re def getpy(word): """ 将中文字符串全拼字符串 """ pylist = [] for s in word: if '\u4e00' <= s <= '\u9fff': # 如果s是中文字符,则使用re模块进行匹配 charcode = ord(s) - 0x4e00 # 中文字符的编码范围为0x4e00-0x9fff,因此减去0x4e00即可得到对应数字 try: py = re.findall(pylist[charcode]['py'], pycode) # 在pylist中查找对应拼音 pylist[charcode]['used'] = True # 标记已使用 except: py = [s] # 如果未找到对应拼音,则使用中文字符本身 pylist.append({'py': py, 'used': False}) # 将拼音加入拼音列表 else: # 如果s不是中文字符,则无需匹配,直接加入拼音列表 pylist.append({'py': [s], 'used': True}) # 按顺序输出拼音 pystring = '' for p in pylist: if not p['used']: pystring += ''.join(p['py']) return pystring ``` 该函数的实现原理是:首先判断输入的字符s是否是中文字符,如果是,则在pylist中查找中文字符对应的拼音。如果找到,则加入拼音列表,并标记已使用;否则,将中文字符本身加入拼音列表。最后,将拼音按顺序输出即可。 需要注意的是,该函数依赖于拼音库,因此在使用前需要将拼音库复制到代码所在的目录下,并将其命名为“pinyin.txt”。拼音库的格式是每行一个中文字符和它对应的拼音,以空格隔开。例如: ``` 中 zhong1 文 wen2 字 zi4 符 fu2 ``` 该函数可以实现将汉字换为对应的全拼字符串,并可以处理汉字和非汉字混合的情况。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值