- 博客(2)
- 收藏
- 关注
原创 解决Win环境下,使用scrapy的gbk编码问题,UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 220
由于编码问题导致,当框架读取网页的时候无法识别gbk编码产生报错,忽略即可。 在configparser.py 中修改。errors=”ignore” with open(filename, encoding=encoding,errors="ignore") as fp: by:diriers...
2018-09-11 23:24:02 838
原创 糗事百科爬虫Code
糗事百科爬虫 爬取糗事百科的网页并提取数据保存为json格式 -工具: -python class QiuShi(object): def __init__(self): self.url = 'https://www.qiushibaike.com/8hr/page/{}' self.url_page = 'https://www.qiushibaike.com' ...
2018-08-30 15:02:56 277
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人