python爬虫模拟登陆知乎网

最新推荐文章于 2024-06-29 08:30:00 发布

karmalk

最新推荐文章于 2024-06-29 08:30:00 发布

阅读量3.9k

点赞数 1

分类专栏： python爬虫文章标签： python 知乎网爬虫 cookie

本文链接：https://blog.csdn.net/karmacode/article/details/78310967

版权

本文介绍了使用Python进行模拟登录知乎的过程，通过BeautifulSoup库实现。在学习中，作者了解到_XSRF令牌的作用是防止CSRF攻击，并指出模拟登录通常涉及获取登录表单，填充数据并使用返回的cookies进行后续请求。虽然实际的验证码识别被略过，但作者强调验证码处理在模拟登录中的重要性，以及不同网站的用户信息加密方式可能存在的复杂性。

摘要由CSDN通过智能技术生成

自从暑假学了大概一个月左右的爬虫，开学之后就没怎么搞爬虫了，当时也就学到scrapy框架就放下了，大致了解了一下框架，不是太理解，但是在这之前本人的爬虫水平也仅仅局限于爬取简单页面，爬取动态页面也稍微了解下，但是一直没有学模拟登陆，因为当时怎么也搞不懂模拟登陆是怎么个回事，包括保存页面cookies也不知道，
最近有重新拾起爬虫，准备将爬虫再进阶一下，于是找到了网上一些视频看到有个用beautifulSoup实现模拟登录知乎，感觉挺容易上手的。下面，贴代码

import requests
from bs4 import BeautifulSoup

url = "https://www.zhihu.com/#signin"

#请求报头
def zhihuLogin(url):
    headers = {
        "User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537

最低0.47元/天解锁文章

karmalk

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
python爬虫模拟登陆知乎网

自从暑假学了大概一个月左右的爬虫，开学之后就没怎么搞爬虫了，当时也就学到scrapy框架就放下了，大致了解了一下框架，不是太理解，但是在这之前本人的爬虫水平也仅仅局限于爬取简单页面，爬取动态页面也稍微了解下，但是一直没有学模拟登陆，因为当时怎么也搞不懂模拟登陆是怎么个回事，包括保存页面cookies也不知道，最近有重新拾起爬虫，准备将爬虫再进阶一下，于是找到了网上一些视频看到有个用beautif
复制链接

扫一扫

专栏目录