Java——获取字符串编码格式

判断一个字符串的编码格式: 

    public static String getEncoding(String str) {
        String encode = "GB2312";
        try {
            if (isEncoding(str, encode)) { // 判断是不是GB2312
                return encode;
            }
        } catch (Exception exception) {
        }
        encode = "ISO-8859-1";
        try {
            if (isEncoding(str, encode)) { // 判断是不是ISO-8859-1
                return encode;
            }
        } catch (Exception exception1) {
        }
        encode = "UTF-8";
        try {
            if (isEncoding(str, encode)) { // 判断是不是UTF-8
                return encode;
            }
        } catch (Exception exception2) {
        }
        encode = "GBK";
        try {
            if (isEncoding(str, encode)) { // 判断是不是GBK
                return encode;
            }
        } catch (Exception exception3) {
        }
        return ""; // 如果都不是,说明输入的内容不属于常见的编码格式。
    }

    public static boolean isEncoding(String str, String encode) {
        try {
            if (str.equals(new String(str.getBytes(), encode))) {
                return true;
            }
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
        return false;
    }

  • 19
    点赞
  • 40
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 7
    评论
可以使用 Java 的 `getBytes()` 方法获取字符串编码格式,例如: ```java String str = "你好,世界!"; byte[] bytes = str.getBytes(); String charset = "UTF-8"; // 默认编码格式为 UTF-8 if (bytes[0] == -17 && bytes[1] == -69 && bytes[2] == -65) { charset = "UTF-8"; // UTF-8 编码格式的 BOM 头 } else if ((bytes[0] & 0xFF) == 0xFE && (bytes[1] & 0xFF) == 0xFF) { charset = "UTF-16BE"; // UTF-16 大端编码格式的 BOM 头 } else if ((bytes[0] & 0xFF) == 0xFF && (bytes[1] & 0xFF) == 0xFE) { charset = "UTF-16LE"; // UTF-16 小端编码格式的 BOM 头 } else { for (int i = 0; i < bytes.length; i++) { if ((bytes[i] & 0xFF) <= 0x7F) { // ASCII 字符 continue; } else if ((bytes[i] & 0xFF) >= 0xC0 && (bytes[i] & 0xFF) <= 0xDF && i + 1 < bytes.length) { // 双字节字符 if ((bytes[i + 1] & 0xFF) >= 0x80 && (bytes[i + 1] & 0xFF) <= 0xBF) { i += 1; charset = "GBK"; // GBK 编码格式 } } else if ((bytes[i] & 0xFF) >= 0xE0 && (bytes[i] & 0xFF) <= 0xEF && i + 2 < bytes.length) { // 三字节字符 if ((bytes[i + 1] & 0xFF) >= 0x80 && (bytes[i + 1] & 0xFF) <= 0xBF && (bytes[i + 2] & 0xFF) >= 0x80 && (bytes[i + 2] & 0xFF) <= 0xBF) { i += 2; charset = "UTF-8"; // UTF-8 编码格式 } } else if ((bytes[i] & 0xFF) >= 0xF0 && (bytes[i] & 0xFF) <= 0xF7 && i + 3 < bytes.length) { // 四字节字符 if ((bytes[i + 1] & 0xFF) >= 0x80 && (bytes[i + 1] & 0xFF) <= 0xBF && (bytes[i + 2] & 0xFF) >= 0x80 && (bytes[i + 2] & 0xFF) <= 0xBF && (bytes[i + 3] & 0xFF) >= 0x80 && (bytes[i + 3] & 0xFF) <= 0xBF) { i += 3; charset = "UTF-8"; // UTF-8 编码格式 } } else { charset = "GBK"; // 默认编码格式为 GBK } } } System.out.println("字符串编码格式为:" + charset); ``` 该代码通过判断字符串的 BOM 头和字符集区间来确定字符串编码格式,其中支持的编码格式包括 UTF-8、UTF-16BE、UTF-16LE 和 GBK。如果字符串是 ASCII 字符,则默认编码格式为 UTF-8。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

前方一片光明

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值