中文数字转阿拉伯数字Java优雅实现

支持以下中文数字的解析:“点 廿卅 零一二三四五六七八九 十百千万亿”。

测试代码:

    public static void main(String[] args) {
        // 测试代码
        testParseChineseNumber("一二三四五", 12345);
        testParseChineseNumber("二零一二", 2012);
        testParseChineseNumber("一亿二千万零三万四千五百六十七", 120034567);
        testParseChineseNumber("一百二十万三千零四十亿五千万零六十万七千八百九十", 120304050607890L);

        testParseChineseNumber("一万万", 100000000);
        testParseChineseNumber("一三五七九点二四六八零", 13579.24680);

        testParseChineseNumber("一万千", Double.NaN);
        testParseChineseNumber("二二十", Double.NaN);
        testParseChineseNumber("二十三十", Double.NaN);
    }

全部程序:

public class ParseChineseNumber {

    private static final String nums = "零一二三四五六七八九";
    private static final String units = "十百千万亿";
    private static final int[] unitsScales = {10, 100, 1000, 10000, 100000000};

    private static long parseChineseNumberWithoutUnit(String str) {
        long result = 0L;
        for (int i = 0; i < str.length(); i++) {
            char ch = str.charAt(i);
            int num = nums.indexOf(ch);
            assert num >= 0;
            result = result * 10L + num;
        }
        return result;
    }

    private static double parseChineseNumberWithUnit(String str) {
        if (!containsUnit(str)) {
            return parseChineseNumberWithoutUnit(str);
        }

        long num = 0L;

        int lastUnit = units.length();
        boolean lastIsNum = false;
        Deque<Long> stack = new ArrayDeque<>();

        for (int i = 0; i < str.length(); i++) {
            char ch = str.charAt(i);
            int unit = units.indexOf(ch);
            if (unit >= 0) {
                // 遇到单位
                if (lastIsNum) {
                    if (unit < lastUnit) {
                        num *= unitsScales[unit];
                    }
                    stack.addLast(num);
                    if (unit >= lastUnit) {
                        if (!compactStack(stack, unit)) {
                            // 单位顺序不符合预期(非法)
                            return Double.NaN;
                        }
                    }
                } else {
                    assert !lastIsNum;
                    if (unit < lastUnit) {
                        // 单位后跟着更小的单位(非法):二百十
                        return Double.NaN;
                    }
                    if (unit >= lastUnit) {
                        if (!compactStack(stack, unit)) {
                            // 单位顺序不符合预期(非法)
                            return Double.NaN;
                        }
                    }
                }

                lastUnit = unit;
                lastIsNum = false;
                num = 0L;
            } else {
                // 遇到数字
                if (lastIsNum && num != 0) {
                    if (!containsUnit(str)) {
                        // 遇到连续数字(开头已处理,理论上不会走到这里)
                        return parseChineseNumberWithoutUnit(str);
                    } else {
                        // 遇到连续数字,并且带着单位(非法)
                        return Double.NaN;
                    }
                }
                num = nums.indexOf(ch);
                lastIsNum = true;
            }
        }

        // 边界条件:末尾的个位数字入栈
        if (lastIsNum) {
            stack.addLast(num);
        }

        // 弹栈,并计算栈中使用数字之和,同时检查数字单位从小到大顺序
        long total = 0L;
        while (!stack.isEmpty()) {
            num = stack.pollLast();
            if (num <= total) {
                return Double.NaN;
            }
            total += num;
        }

        return total;
    }

    private static boolean compactStack(Deque<Long> stack, int unit) {
        long unitNum = unitsScales[unit];
        long total = 0L;
        boolean pop = false;
        while (!stack.isEmpty() && stack.peekLast() <= unitNum) {
            total += stack.pollLast();
            pop = true;
        }
        if (pop) {
            total *= unitsScales[unit];
            stack.addLast(total);
            return true;
        }
        return false;
    }

    private static boolean containsUnit(String str) {
        for (int i = 0; i < str.length(); i++) {
            char ch = str.charAt(i);
            int unit = units.indexOf(ch);
            if (unit >= 0) {
                return true;
            }
        }
        return false;
    }

    public static double parseChineseNumber(String str) {
        // 可能出现的汉字:点 廿卅 零一二三四五六七八九 十百千万亿
        str = str.replace("廿", "二十").replace("卅", "三十");
        int pointOffset = str.indexOf('点');
        String intPart = str;
        String decimalPart = "";
        if (pointOffset >= 0) {
            intPart = str.substring(0, pointOffset);
            decimalPart = str.substring(pointOffset + 1);
        }

        double intNumber = parseChineseNumberWithUnit(intPart);
        long decimalNumber = parseChineseNumberWithoutUnit(decimalPart);

        return intNumber + Double.valueOf("." + decimalNumber);
    }

    public static void testParseChineseNumber(String str, double expected) {
        double actual = parseChineseNumber(str);
        System.out.println(str + " => " + actual);

        if (Double.isNaN(expected)) {
            // NOTE: Double.NaN != Double.NaN
            assert Double.isNaN(actual) : str + " != " + expected;
        } else {
            assert expected == actual : str + " != " + expected;
        }
    }

    public static void main(String[] args) {
        // 测试代码
        testParseChineseNumber("一二三四五", 12345);
        testParseChineseNumber("二零一二", 2012);
        testParseChineseNumber("一亿二千万零三万四千五百六十七", 120034567);
        testParseChineseNumber("一百二十万三千零四十亿五千万零六十万七千八百九十", 120304050607890L);

        testParseChineseNumber("一万万", 100000000);
        testParseChineseNumber("一三五七九点二四六八零", 13579.24680);

        testParseChineseNumber("一万千", Double.NaN);
        testParseChineseNumber("二二十", Double.NaN);
        testParseChineseNumber("二十三十", Double.NaN);
    }
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值