utf-8 神秘符号 efbf bdef bfbd 锟斤拷

utf-8 神秘符号 efbf bdef bfbd

很多时候我们在打开utf-8的时候会有 � 等很多像问号的编码出现
这时候我们打开这个文件的二进制就会发现 问号对应的十六进制编码就是
efbf bdef bfbd。这个编码到底是什么呢?为什么会有这种编码呢。
这就要从各种编码格式的转换说起。而且大部分出现这种问题的就是用gbk编码的文件
用utf-8编码格式打开。当编码格式中出现utf-8无法解析的字节,那么这个字节就会被
替换成 efbf bdef bfbd 这时我们会发现文件大小也发生了改变,因为未知字节全部
变成三个未知字节。
而这时候再将其转换为gbk
锟 (0xEFBF),斤(0xBDEF),拷(0xBFBD)
这就是 锟斤拷
那么我是在什么时候发现这个问题:
python 的 print 我们一般都会把python代码设置成全局utf-8编码。
这时候如果你收到的是一个gbk的编码,但是直接打出来。就会发现出现很多问号。
这个时候直接复制粘贴再看二进制就不是真正接受的数据。因为print自动将收到的
数据进行了utf-8解码。这样无法解析的编码就变成efbf bdef bfbd。
所以在遇到乱码的时候就需要在数据的原始接受处,及第一次转码发生之前将数据用二进制写入文件留存

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值