![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python爬虫
1400720231
这个作者很懒,什么都没留下…
展开
-
session 验证码登录豆瓣看《头号玩家》评论
豆瓣前面的评论是不需要登录就可以get下来的的,后面到一定页数就需要验证了,不登录就爬不了。我还是采用了session先post在get 的方法本人小白,不喜勿喷,一起交流,一起进步代码地址:https://github.com/1400720231/Python-Spider/tree/master/session_post_douban1、在登录界面观察需要提交的表单数据...原创 2018-04-07 15:45:19 · 336 阅读 · 1 评论 -
cookie 登录github
cookie登录github环境:1、python3.5.22、Ubuntu16.041、登陆你的github帐号后,找到cookie信息2、构建headers信息headers = {"User-Agent":"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) ...原创 2018-04-09 09:24:10 · 779 阅读 · 0 评论 -
cookie登陆qq空间的两种方式
标题: qq空间cookie登陆的两种方式requests.get(url,headers) 其中cookie在headers头文件中,每次请求都要带上headerss=request.session() s.cookies[‘xxxxx’] = “cookie的值”,每次请求不用再带上headers,直接get就好 1、需求分析:登陆qq空间实现个人或者好友的说说列...原创 2018-04-09 10:52:55 · 20948 阅读 · 4 评论 -
cookie登录知乎
用cookie登录个人知乎主页步骤: 1、用自己账号登录知乎,然后复制下来自己的cookie信息。 2、用request.get(url,headers=headers)把cookie传入get请求中 3、用BeautifulSoup匹配内容一、用自己账号登录知乎,获取自己的cookie信息。二、构造请求函数,并把cookie信息加入...原创 2018-04-06 11:28:46 · 4399 阅读 · 3 评论 -
session登录github
用session 获取token值,构建表单登录github环境:ubuntu 16.04python 3.5.2requests库和BeautifulSoup库1、打开github登录页面,输入一个错的账号密码,发现表单数据为下面这样也就是说我们需要post过去的数据为这样子的:data = { 'authenticity_...原创 2018-04-07 00:50:00 · 718 阅读 · 0 评论 -
selenium + Chrome 模拟浏览器爬淘宝信息
环境:ubuntu16.04python3.5.2版本 67.0.3396.87(正式版本) (64 位)chromedriver 2.40安装所需工具:1 selenium三方库安装pip install selenium # 安装selenium库2 chromedriver安装 chromedriver官网地址: http://chrom...原创 2018-06-18 17:20:52 · 1594 阅读 · 0 评论