java根据类型不确定的字符串获取时间

java根据类型不确定的字符串获取时间
输入一串字符串日期,掺杂其他字符并且格式不确定,可能是XX年XX月XX日格式,也可能是XX.XX.XX,也可能是XX-XX-XX,均可获取出对应格式日期

 public static String testDate(String input){
        input=StringUtils.deleteWhitespace(input);
        String regex = "\\d{4}年\\d{1,2}月\\d{1,2}日";
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(input);
        String date=null;
        if (matcher.find()) {
            date = matcher.group();
        }
        if (StringUtil.isNullOrBlank(date)){
            regex = "\\d{4}.\\d{1,2}.\\d{1,2}";
            pattern = Pattern.compile(regex);
            matcher = pattern.matcher(input);
            if (matcher.find()) {
                date = matcher.group();
            }
        }
        if (StringUtil.isNullOrBlank(date)){
            regex = "\\d{4}-\\d{1,2}-\\d{1,2}";
            pattern = Pattern.compile(regex);
            matcher = pattern.matcher(input);
            if (matcher.find()) {
                date = matcher.group();
            }
        }
        return date;
    }
   public static void main(String[] args) {
        System.out.println(testDate("49年(至2023年10月1日止)"));//输出2023年10月1日
        System.out.println(testDate("今日2023.11.12"));//输出2023.11.12
        System.out.println(testDate("测试2023 -0 1-12"));//输出2023-01-12
    }
  • 7
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
可以使用 Java 的 `getBytes()` 方法获取字符串的编码格式,例如: ```java String str = "你好,世界!"; byte[] bytes = str.getBytes(); String charset = "UTF-8"; // 默认编码格式为 UTF-8 if (bytes[0] == -17 && bytes[1] == -69 && bytes[2] == -65) { charset = "UTF-8"; // UTF-8 编码格式的 BOM 头 } else if ((bytes[0] & 0xFF) == 0xFE && (bytes[1] & 0xFF) == 0xFF) { charset = "UTF-16BE"; // UTF-16 大端编码格式的 BOM 头 } else if ((bytes[0] & 0xFF) == 0xFF && (bytes[1] & 0xFF) == 0xFE) { charset = "UTF-16LE"; // UTF-16 小端编码格式的 BOM 头 } else { for (int i = 0; i < bytes.length; i++) { if ((bytes[i] & 0xFF) <= 0x7F) { // ASCII 字符 continue; } else if ((bytes[i] & 0xFF) >= 0xC0 && (bytes[i] & 0xFF) <= 0xDF && i + 1 < bytes.length) { // 双字节字符 if ((bytes[i + 1] & 0xFF) >= 0x80 && (bytes[i + 1] & 0xFF) <= 0xBF) { i += 1; charset = "GBK"; // GBK 编码格式 } } else if ((bytes[i] & 0xFF) >= 0xE0 && (bytes[i] & 0xFF) <= 0xEF && i + 2 < bytes.length) { // 三字节字符 if ((bytes[i + 1] & 0xFF) >= 0x80 && (bytes[i + 1] & 0xFF) <= 0xBF && (bytes[i + 2] & 0xFF) >= 0x80 && (bytes[i + 2] & 0xFF) <= 0xBF) { i += 2; charset = "UTF-8"; // UTF-8 编码格式 } } else if ((bytes[i] & 0xFF) >= 0xF0 && (bytes[i] & 0xFF) <= 0xF7 && i + 3 < bytes.length) { // 四字节字符 if ((bytes[i + 1] & 0xFF) >= 0x80 && (bytes[i + 1] & 0xFF) <= 0xBF && (bytes[i + 2] & 0xFF) >= 0x80 && (bytes[i + 2] & 0xFF) <= 0xBF && (bytes[i + 3] & 0xFF) >= 0x80 && (bytes[i + 3] & 0xFF) <= 0xBF) { i += 3; charset = "UTF-8"; // UTF-8 编码格式 } } else { charset = "GBK"; // 默认编码格式为 GBK } } } System.out.println("字符串的编码格式为:" + charset); ``` 该代码通过判断字符串的 BOM 头和字符集区间来确定字符串的编码格式,其支持的编码格式包括 UTF-8、UTF-16BE、UTF-16LE 和 GBK。如果字符串是 ASCII 字符,则默认编码格式为 UTF-8。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值