自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 HTTP status code is not handled or not allowed的解决方法

用scrapy框架爬取豆瓣电影时,运行阶段遇到以下错误提示 在检查完代码确定无误后,试着在settings里面加上一个user-agent 程序成功爬取到了豆瓣电影数据 ...

2019-08-31 21:50:25 9872 4

原创 关于extract()方法后带参数的说明

extract方法一般用于将源码结构的字符提取为格式化文本,在extract未带参数时可见所提取文本有列表符号 加上参数后

2019-08-31 21:45:43 1061

原创 关于scrapy框架下的xpath的文本提取

在scrapy框架下爬虫传智播客讲师信息时遇到了 此时xpath提取到的只是页面对象,不是文本,解决此方法须在方法后面加上extract即可

2019-08-29 21:47:31 1266

原创 python在出现UnicodeEncodeError: 'gbk' codec can't encode character '\xa9' in position 11163问题的解决办法

在写入本地文件时报错: UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa9’ in position 11163: illegal multibyte sequence 此问题出现时先转码为GBK,在加上ignore参数,在解码为GBK即可解决 如图:在本地文件进行查看即可发现已经完整写入网页源码: ...

2019-08-25 17:05:04 3172

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除