昨天熬夜重温成龙的《醉拳2》 真的是牛 ~,龙叔年轻的时候还是帅的。。。。。,比一些流量小生强多了。。。。
感觉龙叔好像只会唱一首歌,就是那个"我颠颠又倒倒。。。。"之类的。。。。。
不扯犊子了/。。。。。。‘。。’‘。
知乎登录有点难搞,,我这是一个简单的登陆模板。。。
鼠标点击之类完全处理不了。。。。。。。。。。。。。
session 可以理解为一个自带cookie的requests吧!
import requests
from bs4 import BeautifulSoup
import lxml
import time
#自动获取cookie信息的session对象
session = requests.session()
#第一次用get方法获取cookies信息
headers ={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36"}
il = session.get(
url = "https://www.zhihu.com/signin?next=%2F",
#伪装成浏览器
headers= headers
)
#打印知乎的登陆界面html文本
print(il.text)
#创建html对象,主要为了下载验证码图片
#这三步其实不知道有什么作用。。。
soup = BeautifulSoup(il.text,features = "lxml")
#找到标签名字为name 属性名为 name = xarf
xrsf_tag = soup.find(name = "input",attrs = {'name':'xarf'})
xrsf = xrsf_tag.get('value')
current_time = time.time()
#通过get请求下载验证码图片
i2 = session.get(
url = "xxxxx",
params = {'r':current_time,'type':'login'},
headers = headers
)
#将图片回写到你的本地
with open('zhihu.gif','wb') as f:
f.write(i2.content)
#需要发送的data表单
captcha = input('请输入验证码')
form_data = {
"_xarf": 'xarf',
"password":"xxxxxx",
"captcha" : captcha,
'email':'xxxxxxxxx'}
i3 = session.post(url = "https://www.zhihu.com/signin?next=%2F",
data = form_data,
headers = headers
)
i4 = session.get(url = "xxxx",
headers = headers)