Python爬虫 requests使用post请求登录需要验证码的网站

最新推荐文章于 2024-04-18 11:06:07 发布

haeasringnar

最新推荐文章于 2024-04-18 11:06:07 发布

阅读量1.3w

点赞数 3

分类专栏： Python 文章标签： Python requests bs4 验证码登录

本文链接：https://blog.csdn.net/haeasringnar/article/details/82562729

版权

Python 专栏收录该内容

151 篇文章 14 订阅

订阅专栏

具体代码为：

import requests
from bs4 import BeautifulSoup

s = requests.Session()

get_url = 'http://so.gushiwen.org/user/login.aspx?from=http://so.gushiwen.org/user/collect.aspx'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36',
}

r = s.get(url=get_url, headers=headers)

soup = BeautifulSoup(r.text, 'lxml')
a = soup.select('#__VIEWSTATE')[0].attrs.get('value')
b = soup.select('#__VIEWSTATEGENERATOR')[0].attrs.get('value')

# 获取验证码图片的url
image_url = 'http://so.gushiwen.org' + soup.select('#imgCode')[0].attrs.get('src')
# 将图片下载到本地
# print(image_url)
# import urllib.request
r = s.get(image_url)
# urllib.request.urlretrieve(image_url, './yanzhengma.jpg')
with open('./yanzhengma.jpg', 'wb') as fp:
    fp.write(r.content)

# 让用户输入验证码
code = input('请输入验证码:')

post_url = 'http://so.gushiwen.org/user/login.aspx?from=http%3a%2f%2fso.gushiwen.org%2fuser%2fcollect.aspx'
data = {
    '__VIEWSTATE': a,
    '__VIEWSTATEGENERATOR': b, 
    'from': 'http://so.gushiwen.org/user/collect.aspx',
    'email': '17312345678', # 账号
    'pwd': '123456',  # 密码
    'code': code,  # 验证码
    'denglu': '登录',
}

r = s.post(post_url, headers=headers, data=data)

print(r.text)

这里的图片验证码需要注意的是，要携带着一些信息去下载，否则每次都会改变验证码，本例中就是携带着cookies去下载的图片，然后在本地查看后输入验证码进行模拟登陆

haeasringnar

关注

3
点赞
踩
31

收藏

觉得还不错? 一键收藏
打赏
4
评论
Python爬虫 requests使用post请求登录需要验证码的网站

具体代码为：import requestsfrom bs4 import BeautifulSoups = requests.Session()get_url = 'http://so.gushiwen.org/user/login.aspx?from=http://so.gushiwen.org/user/collect.aspx'headers = { 'User-Ag...
复制链接

扫一扫