进入古诗文网站个人中心,绕过登录

古诗文网-古诗文经典传承

故意输错密码,点击登录,获取登录 url,以及登录所需要携带的参数

__VIEWSTATE: 5KweV6Al3Bxs3eTONplApnHlJpUFEExiebrmbhSc6X08+Op/yQUI/TYTDrCQsG2wjhuR1toG6DtR/X+VCCP9q/4hgbQhAn+4ZpfqNf3LdEo+Vd2BZLuo/EbUGrM=
__VIEWSTATEGENERATOR: C93BE1AE
from: http://so.gushiwen.cn/user/collect.aspx
email: 1378178205@qq.com
pwd: 4444444
code: LL1A
denglu: 登录
(1)解决反爬设置的隐藏域 __VIEWSTATE   __VIEWSTATEGENERATOR 一般看不到的数据都在页面的源码,在页面的源码中查找,找到了如下:

<input type="hidden" name="__VIEWSTATE" id="__VIEWSTATE" value="5KweV6Al3Bxs3eTONplApnHlJpUFEExiebrmbhSc6X08+Op/yQUI/TYTDrCQsG2wjhuR1toG6DtR/X+VCCP9q/4hgbQhAn+4ZpfqNf3LdEo+Vd2BZLuo/EbUGrM=" />
</div>
<div>
	<input type="hidden" name="__VIEWSTATEGENERATOR" id="__VIEWSTATEGENERATOR" value="C93BE1AE" />
</div>
验证码 code

验证码是一张图片,可以把验证码图片下载到本地识别。此次就人工直接查看吧

源码:

from bs4 import BeautifulSoup
def Rgushiwen():
    #(1) 获取验证码、__VIEWSTATE、__VIEWSTATEGENERATOR
    url = 'https://so.gushiwen.cn/user/login.aspx?from=http://so.gushiwen.cn/user/collect.aspx'  # 登录接口
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0'
    }
    response = requests.post(url=url,headers=headers) # 获取页面源码
    content = response.text
    soup = BeautifulSoup(content,'lxml')  # 解析页面源码
    viewstate = soup.select('#__VIEWSTATE')[0].attrs.get('value') # 获取 __VIEWSTATE
    viewstategenerator = soup.select('#__VIEWSTATEGENERATOR')[0].attrs.get('value') #获取 __VIEWSTATEGENERATOR
    # print(viewstate,viewstategenerator)
    code = soup.select('#imgCode')[0].attrs.get('src') # 获取验证码图片地址
    code_url = 'https://so.gushiwen.cn' + code
    session = requests.session() # 通过session 的返回值使请求变成一个对象
    response_code =  session.get(code_url) # 验证码内容
    content_code = response_code.content  # 图片二进制获取
    with open('code.jpg','wb') as fp:
        fp.write(content_code)
    code_name = input('请输入验证码')
    # (2)登录
    url_post = 'https://so.gushiwen.cn/user/login.aspx?from=http%3a%2f%2fso.gushiwen.cn%2fuser%2fcollect.aspx'
    data_post = {
        '__VIEWSTATE':viewstate,
        '__VIEWSTATEGENERATOR': viewstategenerator,
        'from':'http://so.gushiwen.cn/user/collect.aspx',
        'email':'1378178205@qq.com',
        'pwd': '123456oo',
        'code': code_name,
        'denglu': '登录'
    }
    response_post = session.post(url=url,headers=headers,data=data_post)
    content_post = response_post.text
    with open('gushiwen.html','w',encoding='utf-8') as fp:
        fp.write(content_post)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值