爬虫三、cookies---自动登录并发表评论

登陆博客并发表评论

一、cookies 及用法

(cookies—cookie的复数–[ˈkuki]-- 饼干)
cookies是服务器为了标记用户,存储在用户本地的数据,它里面也保存了用户的登录信息,同时它有一定的时效性,过期就会失效。
打开网址:
https://wordpress-edu-3autumn.localprod.oc.forchange.cn/wp-login.php
右击打开“检查”工具,点击【network】,勾选【preserve log】(持续显示请求记录,防止请求记录被刷新)。
展开第0个请求【wp-login.php】,浏览一下【headers】。在【General】键里,我们可以先只看前两个参数【Request URL】(请求网址)和【Request Method】(请求方式)。
get请求是明文显示,应用于获取网页数据,而像账号密码这种私密的信息,就应该用post的请求,post是非明文显示,应用于向网页提交数据.
使用post请求的格式:

login_in = requests.post(url,headers=headers,data=data)

和get请求的区别在于,一个是带data参数,一个是带params参数data的位置存在于,XHR里的Headers里的,From data
可以发现,当是get请求时,最后一个参数是params;当是post请求时,最后一个参数通常是data
在Headers中,还有一个【response headers】存储的是服务器的响应信息
get和post是两种最常用的请求方式,除此之外,还有其他类型的请求方式,如head、options等
Response Headers它存储的是服务器的响应信息,在这里面,可以找到cookies,当你登录网页时,服务器就会生成一个cookies和你的账号绑定。接着,它把这个cookies告诉你的浏览器,让浏览器把cookies存储到你的本地电脑。在下一次访问时,浏览器就能带着cookies直接登录,不需要再重复输入账号密码。
【response headers】里有set cookies的参数。set cookies就是服务器往浏览器写入了cookies。
当你登录账号并勾选“记住我”,服务器就会生成一个cookies和这个账号绑定。接着,它把这个cookies告诉你的浏览器,让浏览器把cookies存储到你的本地电脑。当下一次,浏览器带着cookies访问时服务器会知道你是谁,你不需要再重复输入账号密码,即可直接访问。
headers–form data
在这里插入图片描述
log和pwd显然是我们的账号和密码,wp-submit是登录的按钮,redirect_to后面带的链接是我们登录后会跳转到的这个页面网址.

登陆的代码示例:

import requests
#引入requests。
url = ' https://wordpress-...........'
#把登录的网址赋值给url。
headers = {
   
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'
}
#加请求头,请求头是为了模拟浏览器正常的访问,避免被反爬虫。
data = {
   
'log': '.....',  #写入账户
'pwd': '.......',  #写入密码
'wp-submit': '登录',
'redirect_to': 'https://wordpress.....',
'testcookie': '1'
}
#把有关登录的参数封装成字典,赋值给data。
login_in = requests.post(url,headers=headers,data=data)
#用requests.post发起请求,放入参数:请求登录的网址、请求头和登录参数,然后赋值给login_in。
print(login_in)
#打印login_in

打印结果:Response [200],返回了200的状态码,意味着服务器接收到并响应了登录请求。
登陆网站并发表评论的代码示例:

import requests
#引入requests。
url = ' https://wordpre.....'
#把请求登录的网址赋值给url。
headers = {
   
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'
}
#加请求头,前面有说过加请求头是为了模拟浏览器正常的访问,避免被反爬虫。
data = {
   
'log'
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值