关于一点点的知乎

最新推荐文章于 2024-07-25 09:14:05 发布

路人王_Zz

最新推荐文章于 2024-07-25 09:14:05 发布

阅读量272

点赞数

本文链接：https://blog.csdn.net/weixin_42143003/article/details/103914784

版权

昨天熬夜重温成龙的《醉拳2》真的是牛 ~，龙叔年轻的时候还是帅的。。。。。，比一些流量小生强多了。。。。

感觉龙叔好像只会唱一首歌，就是那个"我颠颠又倒倒。。。。"之类的。。。。。

不扯犊子了/。。。。。。‘。。’‘。

知乎登录有点难搞,,我这是一个简单的登陆模板。。。

鼠标点击之类完全处理不了。。。。。。。。。。。。。

session 可以理解为一个自带cookie的requests吧！

import requests
from bs4 import BeautifulSoup
import lxml
import time
#自动获取cookie信息的session对象
session = requests.session()
#第一次用get方法获取cookies信息
headers ={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36"}
il = session.get(
    url = "https://www.zhihu.com/signin?next=%2F",
    #伪装成浏览器
    headers= headers
)
#打印知乎的登陆界面html文本
print(il.text)
#创建html对象,主要为了下载验证码图片

#这三步其实不知道有什么作用。。。
soup = BeautifulSoup(il.text,features = "lxml")
#找到标签名字为name 属性名为 name = xarf
xrsf_tag = soup.find(name = "input",attrs = {'name':'xarf'})
xrsf = xrsf_tag.get('value')


current_time = time.time()
#通过get请求下载验证码图片
i2 = session.get(
    url = "xxxxx",
    params = {'r':current_time,'type':'login'},
    headers = headers
)
#将图片回写到你的本地
with open('zhihu.gif','wb') as f:
    f.write(i2.content)
#需要发送的data表单
captcha = input('请输入验证码')
form_data = {
    "_xarf": 'xarf',
    "password":"xxxxxx",
    "captcha" : captcha,
    'email':'xxxxxxxxx'}
i3 = session.post(url = "https://www.zhihu.com/signin?next=%2F",
                  data = form_data,
                  headers = headers
                  )
i4 = session.get(url = "xxxx",
                 headers = headers)