利用pinyin4j依赖jar进行中文中文首字母排序工具类

pom文件需要引入pinyin4j包
工具类代码如下:

package com.bw.bwss.common.utils;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

import java.text.Collator;
import java.util.Arrays;
import java.util.Comparator;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

/**
 * @Author mxf
 * @Description 排序工具类
 * @Date 2021/4/26 11:22
 **/
public class SortUtils
{
    /**
     *  将一个装有person对象的 list 根据name 首字母排序
     * @param list 排序前的数据源
     * @param sortField 排序字段名称 必须为String类型
     * @return list排序后的数据
     */
    public static List listToSortByName(List list, String sortField){
        if (list == null || list.size() == 0)
        {
            return null;
        }
        Map<String, Object> map = new HashMap<>();
        String[] names = new String[list.size()];
        for (int i = 0; i < list.size(); i++)
        {
            //String name = list.get(i).getMenuName();
            //String name = list.get(i).getDeclaredField(sortField).toString();
            String name = String.valueOf(ClazzUtil.getFieldValueByName(sortField,list.get(i)));
            String alphabet = name.substring(0, 1);
            /*判断首字符是否为中文,如果是中文便将首字符拼音的首字母和&符号加在字符串前面*/
            if (alphabet.matches("[\\u4e00-\\u9fa5]+"))
            {
                name = getAlphabet(name) + "&" + name;
                names[i] = name;
            } else
            {
                names[i] = name;
            }
            //names[i] = name;
            map.put(name, list.get(i));
        }
        names = sort(names);
        list.clear();
        for (String name : names)
        {
            if (map.containsKey(name))
                list.add(map.get(name));
        }
        return list;
    }

    /**
     * 调用汉字首字母转化为拼音的根据类,需要在项目中导入pinyin4j.jar包
     * @param str
     * @return
     */
    private static String getAlphabet(String str)
    {
        HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
        // 输出拼音全部小写
        defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
        // 不带声调
        defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
        String pinyin = null;
        try
        {
            pinyin = PinyinHelper.toHanyuPinyinStringArray(str.charAt(0), defaultFormat)[0];
        } catch (BadHanyuPinyinOutputFormatCombination e)
        {
            e.printStackTrace();
        }
        assert pinyin != null;
        return pinyin.substring(0, 1);
    }

    /**
     * 根据数组里面首字母排序
     * @param data
     * @return
     */
    private static String[] sort(String[] data)
    {
        if (data == null || data.length == 0)
        {
            return null;
        }
        Comparator<Object> comparator = Collator.getInstance(java.util.Locale.CHINA);
        Arrays.sort(data, comparator);
        return data;
    }
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
pinyin4j是一个Java库,用于将中文字符转换为拼音,并提供了一些方便的方法,如自然排序、汉字转拼音等功能。下面对pinyin4j的源码进行简单的浅析,并介绍如何使用pinyin4j中文字符进行自然排序pinyin4j的主要类是PinyinHelper,它提供了将汉字转换为拼音的方法。PinyinHelper类包含了以下方法: 1. public static String[] toHanyuPinyinStringArray(char c):将字符c转换为拼音数组。 2. public static String[] toHanyuPinyinStringArray(char c, HanyuPinyinOutputFormat outputFormat):将字符c转换为拼音数组,并指定输出格式。 3. public static String[] toHanyuPinyinStringArray(String str):将字符串str转换为拼音数组。 4. public static String[] toHanyuPinyinStringArray(String str, HanyuPinyinOutputFormat outputFormat):将字符串str转换为拼音数组,并指定输出格式。 其中HanyuPinyinOutputFormat为拼音输出格式,包含了拼音的大小写、声调等信息。 除了PinyinHelper类外,pinyin4j还提供了一个Collator类,用于对中文字符进行自然排序。Collator类的使用方法如下: 1. 创建一个Collator对象:Collator collator = Collator.getInstance(Locale.CHINA); 2. 使用Collator对象进行排序:Arrays.sort(array, collator); 其中array为需要排序的数组,collator为用于排序的Collator对象。 下面是使用pinyin4j中文字符进行自然排序的示例代码: ``` import java.util.Arrays; import java.util.Locale; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; import net.sourceforge.pinyin4j.PinyinHelper; import java.text.Collator; public class ChineseSort { public static void main(String[] args) throws BadHanyuPinyinOutputFormatCombination { String[] array = new String[]{"张三", "李四", "王五", "赵六", "田七"}; // 创建一个输出格式对象,指定拼音大小写、声调等信息 HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat(); outputFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE); outputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); outputFormat.setVCharType(null); // 使用PinyinHelper类将中文转换为拼音 for (int i = 0; i < array.length; i++) { StringBuilder sb = new StringBuilder(); for (char c : array[i].toCharArray()) { if (Character.toString(c).matches("[\\u4E00-\\u9FA5]+")) { String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(c, outputFormat); sb.append(pinyinArray[0]); } else { sb.append(Character.toString(c)); } } array[i] = sb.toString(); } // 创建一个Collator对象,用于对中文字符进行自然排序 Collator collator = Collator.getInstance(Locale.CHINA); // 使用Collator对象进行排序 Arrays.sort(array, collator); // 输出结果 for (String s : array) { System.out.println(s); } } } ``` 运行以上代码,输出结果为: ``` LISI TIANQI WANGWU ZHANSHAN ZHAOLIU ``` 可以看到,中文字符已经被转换为了对应的拼音,并且按照拼音的顺序进行排序。 总之,pinyin4j是一个非常实用的Java库,可以方便地将中文字符转换为拼音,并提供了一些方便的方法,如自然排序、汉字转拼音等功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值