自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

fanbest325的博客

fanbest325 CSDN认证博客专家 CSDN认证企业博客

码龄12年

0: 原创

59万+: 周排名

208万+: 总排名

2万+: 访问

: 等级

241: 积分

3: 粉丝

1: 获赞

2: 评论

10: 收藏

私信

关注

热门文章

分类专栏

linux 3篇
java 1篇
spark-core
spark streaming
spark sql 1篇
安装
spark 6篇
scala 1篇
算法 1篇
mysql 1篇

最新评论

从0开始基于python3用scrapy爬取数据
撸完这把戒回复撸完这把戒: 自己找到原因了，是302重定向的问题，requests默认追踪重定向的url
从0开始基于python3用scrapy爬取数据
撸完这把戒: 想问一下作者，在爬取gitlab的时候有没有部分link失败，返回404的？有一些png图片爬取不了 Request URL: http://paas1.cmdrawin.com:8000/hello3/uploads/-/system/project/avatar/36/cephglyph_copy.png Request Method: GET Status Code: 404 Not Found 对比了一下浏览器里面的请求，在请求/users/auth/ldapmain/callback的时候，浏览器返回的302，并且返回头里面有个Set-Cookie: _gitlab_session=xxxx的，后续如果用这个_gitlab_session=xxxx去爬取这个图片能成功；但是我在代码里面请求/users/auth/ldapmain/callback的时候，直接返回200，返回头里面没有Set-Cookie: _gitlab_session=的选项（_gitlab_session该cookie在打开gitlab登录页的时候，gitlab服务端就会返回这个cookie，浏览器里面在登录/users/auth/ldapmain/callback的时候返回头又会重新设置该cookie，但是在爬取代码里面登录/users/auth/ldapmain/callback的时候返回头里面没有该cookie的设置信息了） Request URL: http://gitlab.cmdrawin.com/users/auth/ldapmain/callback Request Method: POST Status Code: 302 Found

最新文章

spark

关注

关注数：文章数：6 文章阅读量：7777 文章收藏量：7

作者: fanbest325

这个作者很懒，什么都没留下…

展开