遇到需要的登录的网站怎么办?用这3招轻松搞定!

你好

 

由于你是游客

 

无法查看本文

 

请你登录再进

 

谢谢合作

 

 

当你在爬某些网站的时候

 

需要你登录才可以获取数据

 

咋整?

 

莫慌

 

小帅b把这几招传授给你

 

让你以后从容应对

 

 

那么

 

接下来就是

 

学习 python 的正确姿势

 

 

登录的常见方法无非是这两种

 

1、让你输入帐号和密码登录

 

 

2、让你输入帐号密码+验证码登录

 

 

今天

 

小帅b先跟你说说第一种

 

需要验证码的咱们下一篇再讲

 

第一招

 

 

Cookie大法

 

你平常在上某个不为人知的网站的时候

 

是不是发现你只要登录一次

 

就可以一直看到你想要的内容

 

过了一阵子才需要再次登录

 

这就是因为 Cookie 在做怪

 

简单来说

 

就是每一个使用这个网站的人

 

服务器都会给他一个 Cookie

 

那么下次你再请求数据的时候

 

你顺带把这个 Cookie 传过去

 

服务器一看

 

诶,小伙子是老客户啊

 

 

有登录过

 

直接返回数据给他吧

 

在服务中还可以设置 Cookie 的有效时间

 

也就是说

 

当你下次携带一个过期了的 Cookie 给服务器的时候

 

服务器虽然知道你是老客户

 

但是还是需要你重新再登录一次

 

然后再给你一个有效的 Cookie

 

Cookie 的时长周期是服务器那边定的

 

ok

 

了解了这一点之后

 

我们就来玩一下吧

 

我们以「逼乎」为例

 

https://biihu.cc/account/login/

 

输入地址之后

 

 

按一下 F12

 

点击 network 标签

 

然后登录你的帐号

 

然后点击其中一个

 

你就可以看到在 Request Headers 有你的 Cookie

 

 

 

有了 Cookie 之后

 

我们在代码中直接获取我的个人信息

 

  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
import requests
headers = {    # 假装自己是浏览器    'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/73.0.3683.75 Chrome/73.0.3683.75 Safari/537.36',    # 把你刚刚拿到的Cookie塞进来    'Cookie': 'eda38d470a662ef3606390ac3b84b86f9; Hm_lvt_f1d3b035c559e31c390733e79e080736=1553503899; biihu__user_login=omvZVatKKSlcXbJGmXXew9BmqediJ4lzNoYGzLQjTR%2Fjw1wOz3o4lIacanmcNncX1PsRne5tXpE9r1sqrkdhAYQrugGVfaBICYp8BAQ7yBKnMpAwicq7pZgQ2pg38ZzFyEZVUvOvFHYj3cChZFEWqQ%3D%3D; Hm_lpvt_f1d3b035c559e31c390733e79e080736=1553505597',}
session = requests.Session()response = session.get('https://biihu.cc/people/wistbean%E7%9C%9F%E7%89%B9%E4%B9%88%E5%B8%85', headers=headers)
print(response.text)

 

运行后可以发现不用登录就可以直接拿到自己的个人信息了

<!DOCTYPE html><html><head><meta content="text/html;charset=utf-8" http-equiv="Content-Type" /><meta content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" name="viewport" /><meta http-equiv="X-UA-Compatible" content="IE=edge,Chrome=1" /><meta name="renderer" content="webkit" /><title>小帅b真特么帅 的个人主页 - 逼乎</title><meta name="keywords" content="逼乎,问答,装逼,逼乎网站" /><meta name="description" content="逼乎 ,与世界分享你的装逼技巧与见解" /><base href="https://biihu.cc/" /><!--[if IE]></base><![endif]--><link rel="stylesheet" type="text/css" href="https://biihu.cc/static/css/bootstrap.css" /><link rel="stylesheet" type="text/css" href="https://biihu.cc/static/css/icon.css" /><link href="https://biihu.cc/static/css/default/common.css?v=20180831" rel="stylesheet" type="text/css" /><link href="https://biihu.cc/static/css/default/link.css?v=20180831" rel="stylesheet" type="text/css" /><link href="https://biihu.cc/static/js/plug_module/style.css?v=20180831" rel="stylesheet" type="text/css" /><link href="https://biihu.cc/static/css/default/user.css?v=20180831" rel="stylesheet" type="text/css" /><link href="https://biihu.cc/static/css/mood/mood.css" rel="stylesheet" type="text/css" /><script type="text/javascript"> var _02AEC94D5CA08B39FC0E1F7CC220F9B4="a5359326797de302bfc9aa6302c001b8"; var G_POST_HASH=_02AEC94D5CA08B39FC0E1F7CC220F9B4; var G_INDEX_SCRIPT = ""; var G_SITE_NAME = "逼乎"; var G_BASE_URL = "https://biihu.cc"; var G_STATIC_URL = "https://biihu.cc/static"; var G_UPLOAD_URL = "/uploads"; var G_USER_ID = "188";  var G_USER_NAME = "小帅b真特么帅"; var G_UPLOAD_ENABLE = "Y"; var G_UNREAD_NOTIFICATION = 0; var G_NOTIFICATION_INTERVAL = 100000; var G_CAN_CREATE_TOPIC = "1"; var G_ADVANCED_EDITOR_ENABLE = "Y"; var FILE_TYPES = "jpg,jpeg,png,gif,zip,doc,docx,rar,pdf,psd";</script><script src="https://biihu.cc/static/js/jquery.2.js?v=20180831" type="text/javascript"></script> ....

 

 

第二招

 

 

表单请求大法

 

很简单

 

就是通过抓包

 

获取请求登录的时候需要用到的用户名密码参数

 

然后以表单的形式请求服务器

 

如果你细心一点的话应该会知道之前说过拉

 

具体在这

去看下

我就不多说了

 

python爬虫03:那个叫做 Urllib 的库让我们的 python 假装是浏览器

 

 

第三招

 

 

Selenium 自动登录法

 

你应该看过这两个

 

python爬虫09 | 上来,自己动 !这就是 selenium 的牛逼之处

python爬虫11 | 这次,将带你爬取b站上的NBA形象大使蔡徐坤和他的球友们

 

看过的话

 

那么对于你来说

 

Selenium 自动登录也太 tm 简单了吧

 

获取到两个输入框的元素

 

再获取到登录按钮

 

往输入框写你的帐号密码

 

然后自动点击一下登录

 

  •  
  •  
  •  
  •  
  •  
  •  
  •  
username = WAIT.until(EC.presence_of_element_located((By.CSS_SELECTOR, "帐号的selector")))password = WAIT.until(EC.presence_of_element_located((By.CSS_SELECTOR, "密码的selector")))submit = WAIT.until(EC.element_to_be_clickable((By.XPATH, '按钮的xpath')))
username.send_keys('你的帐号')password.send_keys('你的密码')submit.click()

 

登录完之后拿到 Cookie

 

  •  
cookies = webdriver.get_cookies()

 

有了 Cookie 你就可以拿到你想要的数据了

 

ok

 

以上这三招

 

 

希望对你有帮助

 

咱们下一篇说说验证码相关

 

下回见

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
OpenWrt是一个基于Linux的嵌入式操作系统,用于路由器和其他嵌入式设备。它提供了丰富的功能和自义选项,但对于一些用户来说,在配置和安装上可能稍显复杂。以下是一个简化的OpenWrt安装教程,只需要三分钟和三个简单的步骤即可完成。 第一步,准备工作。首先,确保你拥有兼容OpenWrt固件的路由器设备,并且已连接好电源和网络线。其次,访问OpenWrt官方网站,下载适用于你的路由器型号和版本的固件文件。将该文件保存到你的计算机上。 第二步,进入路由器管理界面。打开你的浏览器,并在地址栏中输入“192.168.1.1”这个默认的路由器管理IP地址。如果你的路由器IP地址有所不同,请查阅相关的资料。在登录界面输入默认的用户名和密码,通常为“root”和“admin”。登录成功后,你将进入路由器的管理页面。 第三步,安装OpenWrt固件。在路由器管理页面中,找到“系统设置”或“固件升级”等类似选项。点击“浏览”按钮,选择之前下载好的OpenWrt固件文件,并点击“安装”或“升级”按钮。等待数分钟,直到固件文件安装完成并路由器自动重启。 通过以上三个简单的步骤,你就可以完成OpenWrt的安装了。安装完成后,你可以进一步在管理界面中自义设置、添加插件和配置网络等。请注意,在进行任何操作前,务必备份你的路由器配置和数据,以免造成不可挽回的损失。有需要时,也可以参考官方文档和社区论坛,深入了解和利用OpenWrt的更多功能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值