- 博客(4)
- 收藏
- 关注
原创 HTTP status code is not handled or not allowed的解决方法
用scrapy框架爬取豆瓣电影时,运行阶段遇到以下错误提示 在检查完代码确定无误后,试着在settings里面加上一个user-agent 程序成功爬取到了豆瓣电影数据 ...
2019-08-31 21:50:25
9872
4
原创 关于extract()方法后带参数的说明
extract方法一般用于将源码结构的字符提取为格式化文本,在extract未带参数时可见所提取文本有列表符号 加上参数后
2019-08-31 21:45:43
1061
原创 关于scrapy框架下的xpath的文本提取
在scrapy框架下爬虫传智播客讲师信息时遇到了 此时xpath提取到的只是页面对象,不是文本,解决此方法须在方法后面加上extract即可
2019-08-29 21:47:31
1266
原创 python在出现UnicodeEncodeError: 'gbk' codec can't encode character '\xa9' in position 11163问题的解决办法
在写入本地文件时报错: UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa9’ in position 11163: illegal multibyte sequence 此问题出现时先转码为GBK,在加上ignore参数,在解码为GBK即可解决 如图:在本地文件进行查看即可发现已经完整写入网页源码: ...
2019-08-25 17:05:04
3172
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人