gdk编码格式判断

网上遍寻判断是否为gbk编码的方法,发现大家的方法都是一样的(很明显都是ctrl+c/ctrl+v),让我一度怀疑确实是字符串的编码出现了问题。如下所示:

func isGBK(data []byte) bool {	
	if isUtf8(data) {
	    return false
	}
	length := len(data)
	var i int = 0
	for i < length {
		if data[i] <= 0x7f {
			//编码0~127,只有一个字节的编码,兼容ASCII码
			i++
			continue
		} else {
			//大于127的使用双字节编码,落在gbk编码范围内的字符
			if data[i] >= 0x81 &&
				data[i] <= 0xfe &&
				data[i+1] >= 0x40 &&
				data[i+1] <= 0xfe &&
				data[i+1] != 0xf7 {
				i += 2
				continue
			} else {
				return false
			}
		}
	}
	return true
}

但是很遗憾,这个方法中有个很致命的错误。这个错误导致消息中包含某一些字(比如“明“”)的时候,会导致判断出错。

在仔细观察了gbk编码表和gbk编码规则后,总算发现了问题所在。

出错的代码行是:

data[i+1] != 0xf7 

这里应该改成

data[i+1] != 0x7f

至此问题解决。

希望大家在发表文章的时候能仔细一点,不然就特别容易误导别人。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值