手写爬虫模拟登陆(无验证码)

最新推荐文章于 2023-04-30 17:45:49 发布

wang1319864062

最新推荐文章于 2023-04-30 17:45:49 发布

阅读量337

点赞数

文章标签：手写爬虫模拟登陆无验证码

本文链接：https://blog.csdn.net/wang1319864062/article/details/81480816

版权

框架用多了,都是别人写好的一些内容,最近想自己手写一份爬虫模拟登陆系统,手写有什么好处呢?可以让你更好的去理解爬虫系统.我用的linux系统,pycharm版本3.6,

正文

首先手写的你需要安装requests:pip3 install requests
我们以访问抽屉为例:https://dig.chouti.com/
手写模拟登陆,首先我们得访问这个网站,获取cookie(未授权) ,代码如下:
# 1. 先访问抽屉新热榜，获取cookie（未授权）,因为该网站有反爬虫,所以我们加上User-Agent来模拟浏览器访问,urls就是你访问的页面的地址,请求方式为get
r1 = requests.get( url='https://dig.chouti.com/all/hot/recent/1', headers={ 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.89 Safari/537.36 }

接下来我们模拟登陆,模拟登陆我们需要模仿浏览器提交的数据,提交的方式为post,在这里我们带上前面获取的cookie,带上登陆需要的账号密码,并且带上User-Agent来模拟浏览器登陆,不然会被拦截

    response = requests.post(
    url='https://dig.chouti.com/login',
    data={
        'phone':'8613121758648',
        'password':'woshiniba',


    },
    headers={
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.89 Safari/537.36'
    },
    cookies = r1.cookies.get_dict()

最后,我们可以检测有没有登陆成功
print(response.text)
结果如下:
{“result”:{“code”:”9999”, “message”:”“, “data”:{“complateReg”:”0”,”destJid”:”cdu_49803354421”}}}
说明登陆成功了,登陆成功那么该页面我们就可以获取页面和解析页面来爬虫了,这里就不介绍了
总体代码如下:
import requests

r1 = requests.get( url='https://dig.chouti.com/all/hot/recent/1', headers={ 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.89 Safari/537.36' } ) r1_cookie_dict = r1.cookies.get_dict()

response = requests.post( url='https://dig.chouti.com/login', data={ 'phone':'8613121758648', 'password':'woshiniba', },
headers={ 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.89 Safari/537.36' }, cookies = r1.cookies.get_dict() )
print(response.text)

wang1319864062

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
手写爬虫模拟登陆(无验证码)

框架用多了,都是别人写好的一些内容,最近想自己手写一份爬虫模拟登陆系统,手写有什么好处呢?可以让你更好的去理解爬虫系统.我用的linux系统,pycharm版本3.6,正文首先手写的你需要安装requests:pip3 install requests 我们以访问抽屉为例:https://dig.chouti.com/ 手写模拟登陆,首先我们得访问这个网站,获取cookie(未授权...
复制链接

扫一扫