![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
编码我所遇到过的问题
文章平均质量分 53
腾阳
全网同名,欢迎关注,文章首发公号
展开
-
python : 'gbk' codec can't decode byte 0xbe in position 18: illegal multibyte sequenc
在使用python时经常会遇到一些编码的错误例如'gbk' codec can't decode byte 0xbe in position 18: illegal multibyte sequenc源代码片段为很明显从错误中我们可以指导,这是因为文本文档采用的是gbk编码,这个时候我们需要转换成python能识别的编码,比如utf-8...原创 2018-06-03 16:07:37 · 136677 阅读 · 8 评论 -
win10 下python2.7遍历中文文件夹编码问题:ascii' codec can't decode byte 0xe8 in position 60: ordinal not in rang
源代码:big_shuzu = []path = r"C:\Users\ME\Desktop\Python project\pachong\scrapy\baichuan4\证券时报网"。encode('gbk')for root,dirs,files in os.walk(path): print(root) print(dirs) print files for dir in d...原创 2018-06-05 19:32:28 · 693 阅读 · 0 评论 -
python2.7常见的编码问题,Python“Non-ASCII character 'xe5' in file”报错问题
0. 写在前面起因:之前写个数据预处理程序的时候遇到了点问题,用re模块的正则查找方法search时总是找不出来(找错了或者出乱码),于是捣鼓捣鼓。经过:查资料,做实验,发现用utf8编码的str类型的字符串在search方法中行不通,因为str是字节串,和字符之间没有固定的一一对应的关系,正则没法用字节串来进行正确匹配。结果:把正则式和目标字符串都使用unicode类型,unicode和字符之间...转载 2018-06-05 20:30:35 · 1395 阅读 · 0 评论 -
Python3.6+requests 爬取网站遇到中文乱码怎么办?ä½è ï¼å¾®è½¯äºæ´²ç 究é¢
# -*- coding:utf-8 -*-import requestsimport jsonimport timeimport randomfrom lxml import etreeurl = 'https://www.msra.cn/zh-cn/news/features/bma-20170207'# 伪装成Mozilla浏览器,解决反爬虫user_agent = '...原创 2018-07-25 15:39:45 · 7325 阅读 · 0 评论