weixin_44973982-CSDN博客

原创 HTTP status code is not handled or not allowed的解决方法

用scrapy框架爬取豆瓣电影时，运行阶段遇到以下错误提示在检查完代码确定无误后，试着在settings里面加上一个user-agent程序成功爬取到了豆瓣电影数据...

2019-08-31 21:50:25 9880 4

原创关于extract()方法后带参数的说明

extract方法一般用于将源码结构的字符提取为格式化文本，在extract未带参数时可见所提取文本有列表符号加上参数后

2019-08-31 21:45:43 1074

原创关于scrapy框架下的xpath的文本提取

在scrapy框架下爬虫传智播客讲师信息时遇到了此时xpath提取到的只是页面对象，不是文本，解决此方法须在方法后面加上extract即可

2019-08-29 21:47:31 1270

原创 python在出现UnicodeEncodeError: 'gbk' codec can't encode character '\xa9' in position 11163问题的解决办法

在写入本地文件时报错：UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa9’ in position 11163: illegal multibyte sequence此问题出现时先转码为GBK，在加上ignore参数，在解码为GBK即可解决如图：在本地文件进行查看即可发现已经完整写入网页源码：...

2019-08-25 17:05:04 3181

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 HTTP status code is not handled or not allowed的解决方法

原创 关于extract()方法后带参数的说明

原创 关于scrapy框架下的xpath的文本提取

原创 python在出现UnicodeEncodeError: 'gbk' codec can't encode character '\xa9' in position 11163问题的解决办法

空空如也

空空如也

原创关于extract()方法后带参数的说明

原创关于scrapy框架下的xpath的文本提取