Python爬虫闯关-2

第二关

第二关网址: http://www.heibanke.com/lesson/crawler_ex01

第二关就是去登陆,用户名是任意的,密码是0到30中的一个数字,我们一个个试过去就行

步骤

  • 构造请求参数
  • 然后密码从0到30去尝试登陆

代码

#!usr/bin/env python3
# -*- coding: utf-8 -*-

import requests
import re

#定义一个登陆类
class Login(object):
	
	def __init__(self):
		#设置会话对象,命名为session,Session()的作用就相当于在同一个浏览器里进行访问
		#可以跨请求保持cookies,不需要再单独为每个请求设置cookie
		self.session = requests.Session()
		#设置请求头
		self.headers = {
			'Host': 'www.heibanke.com',
			'User-Agent': 'Mozilla/5.0 (iPad; CPU OS 12_0 like Mac OS X) AppleWebKit/604.1.34 (KHTML, like Gecko) CriOS/68.0.3440.83 Mobile/16A5345f Safari/604.1',
			'Accept-Language': 'zh-cn',
			'Accept-Encoding': 'gzip, deflate',
			'Connection': 'keep-alive'
		}
		#设置get和post请求的url
		self.url = 'http://www.heibanke.com/lesson/crawler_ex01/'
		#设置post请求需要提交的数据,'username'和'password'两个参数是必要的,'csf'为空也可以登陆
		self.data = {
			'csrfmiddlewaretoken' : '',
			'username' : 'user',
			'password' : ''
		}
		
	#可以把get_cookies()方法去掉,因为经过测试,即使post的时候,cfs为空也可以进行登陆
	#这里留着是强迫症
	#得到csf
	def get_cookies(self):
		response = self.session.get(url=self.url, headers=self.headers)
		print(response.cookies)
		#取出cookie,可以打印response.cooikes看看里面是什么内容
		self.data['csrfmiddlewaretoken'] = response.cookies['csrftoken']
		
	#进行post登陆
	def post_page(self): 
		response = self.session.post(url=self.url, headers=self.headers, data=self.data)
		#用re,把页面的内容提取出来,方便我们在登陆过程中查看登陆的状态
		text = re.findall('<h3>(.*?)</h3>', response.text, re.S)[0]
		print ('用户名:', self.data['username'],'----密码: ',self.data['password'],'---csf:',self.data['csrfmiddlewaretoken'],'提示信息:',text)
		return text
	def login(self):
		self.get_cookies()
		#从0到30,给'password'设值
		for x in range(31):
			self.data['password'] = str(x)
			text = self.post_page()
			#假如闯关成功,页面就会有成功两个字
			if '成功' in text:
				print('你成功的闯关了!密码是:', x)
				break

if __name__ == "__main__":
	login = Login()
	login.login()

结语:

源码: 点我

欢迎关注我的公众号 疯子的Python笔记

公众号二维码.jpg

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值