Python3爬虫如何模拟登录？

最新推荐文章于 2024-05-02 12:00:51 发布

python学习网py.cn

最新推荐文章于 2024-05-02 12:00:51 发布

阅读量312

点赞数

分类专栏：爬虫 python 文章标签： python 爬虫

原文链接：https://www.py.cn/jishu/jichu/21203.html

版权

python 同时被 2 个专栏收录

54 篇文章 0 订阅

订阅专栏

爬虫

8 篇文章 0 订阅

订阅专栏

专业的术语，总是让我们听得云里雾里，但是总的来说，大家应该都知道爬虫的基本流程吧，首先是将自己进行伪装，跟一个正常的登录使用人员一样，但是最终，别人只是看一遍知识，而我们是需要进行知识的获取的，这也就学会爬虫第一步要知道的内容，好啦话不多说，大家来了解看下吧~

先登录成功1次，获取到携带登陆信息的Cookie

  

 def get_html(self):

 print(html)

 self.parse_html(html)

 def parse_html(self,html)

最终程序实现代码

import requests

from lxml import etree

class RenrenSpider(object):

 def __init__(self):

 self.post_url = '链接'

 self.get_url = '链接'

 self.form_data = {

 'email': '******', # 用户名

 'password': '*******'} # 密码

 self.session = requests.session()

好啦，大家如果如果想要去抓取页面内容，碰到需要登录才可以访问的网站，就可以利用上述小编给大家整理的文案内容了哦~

python学习网py.cn

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python3爬虫如何模拟登录？

专业的术语，总是让我们听得云里雾里，但是总的来说，大家应该都知道爬虫的基本流程吧，首先是将自己进行伪装，跟一个正常的登录使用人员一样，但是最终，别人只是看一遍知识，而我们是需要进行知识的获取的，这也就学会爬虫第一步要知道的内容，好啦话不多说，大家来了解看下吧~先登录成功1次，获取到携带登陆信息的Cookie def get_html(self): print(html) self.parse_html(html) def parse_html(self,html)最终程序实现代码
复制链接

扫一扫

专栏目录