github上的python爬虫_Python爬虫使用脚本登录Github并查看信息

本文介绍了如何使用Python爬虫通过模拟登录Github,并利用获取的cookie访问个人详情页。首先分析了Github登录过程,包括form表单提交、csrf_token、post请求发送用户名和密码以及携带cookie。然后展示了get请求获取token和cookie,接着通过post请求完成登录,最后成功后携带cookie查看个人详情页。
摘要由CSDN通过智能技术生成

前言分析目标网站的登录方式

登录方式做出分析:

第一,用form表单方式提交信息,

第二,有csrf_token,

第三 ,是以post请求发送用户名和密码时,需要第一次get请求的cookie

第四,登录成功以后,请求其他页面是只需要带第一次登录成功以后返回的cookie就可以。

以get发送的请求获取我们想要的token和cookie

7b0b3e78a3dd0255a607028a4a56e8ff.png

a2ffafc4cff765a0f3ac2f726690dcd9.png

代码:

import requests

from bs4 import BeautifulSoup

r1 = requests.get('https://github.com/login')

soup = BeautifulSoup(r1.text,features='lxml') #生成soup 对象

s1 = soup.find(name='input',attrs={'name':'authenticity_token'}).get('value')

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值