中文字符的Unicode编码0x0800-0xFFFF之间,(utf-8包含了部分汉字)
当你试图将该“中文字符”转成U码的utf-8时超出了其范筹
而GBK 规范收录了 ISO 10646.1 中的全部 CJK 汉字和符号,并有所补充,
所以解决方法是将.decode(‘utf-8’)改为.decode(‘gbk’)
'utf-8' codec can't decode byte 0xbc in position 2: invalid start byte
最新推荐文章于 2024-06-10 17:09:54 发布