关于一点点的知乎

昨天熬夜重温成龙的《醉拳2》 真的是牛 ~,龙叔年轻的时候还是帅的。。。。。,比一些流量小生强多了。。。。

感觉龙叔好像只会唱一首歌,就是那个"我颠颠又倒倒。。。。"之类的。。。。。

不扯犊子了/。。。。。。‘。。’‘。

知乎登录有点难搞,,我这是一个简单的登陆模板。。。

鼠标点击之类完全处理不了。。。。。。。。。。。。。

session 可以理解为一个自带cookie的requests吧!

import requests
from bs4 import BeautifulSoup
import lxml
import time
#自动获取cookie信息的session对象
session = requests.session()
#第一次用get方法获取cookies信息
headers ={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36"}
il = session.get(
    url = "https://www.zhihu.com/signin?next=%2F",
    #伪装成浏览器
    headers= headers
)
#打印知乎的登陆界面html文本
print(il.text)
#创建html对象,主要为了下载验证码图片

#这三步其实不知道有什么作用。。。
soup = BeautifulSoup(il.text,features = "lxml")
#找到标签名字为name 属性名为 name = xarf
xrsf_tag = soup.find(name = "input",attrs = {'name':'xarf'})
xrsf = xrsf_tag.get('value')


current_time = time.time()
#通过get请求下载验证码图片
i2 = session.get(
    url = "xxxxx",
    params = {'r':current_time,'type':'login'},
    headers = headers
)
#将图片回写到你的本地
with open('zhihu.gif','wb') as f:
    f.write(i2.content)
#需要发送的data表单
captcha = input('请输入验证码')
form_data = {
    "_xarf": 'xarf',
    "password":"xxxxxx",
    "captcha" : captcha,
    'email':'xxxxxxxxx'}
i3 = session.post(url = "https://www.zhihu.com/signin?next=%2F",
                  data = form_data,
                  headers = headers
                  )
i4 = session.get(url = "xxxx",
                 headers = headers)

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值