python微博 关键词 爬虫

本文介绍了使用Python进行微博爬虫的过程,包括操作环境设定、数据接口的利用、proxy配置、通过关键词获取用户ID以及如何获取和保存相关用户信息。
摘要由CSDN通过智能技术生成

目录

记一次阿里云盾滑块验证分析并通过

操作环境

数据接口

proxy配置

根据关键词获取userid

根据userid获取信息

数据保存

数据:


记一次阿里云盾滑块验证分析并通过

操作环境
  • win10 、 mac
  • Python3.9
数据接口
  • 搜索
https://**********?containerid=100103type%3D{chanenl}%26q%3D{quote(self.words)}&page_type=searchall&page={page}
  • user info
https://**********?title=%E5%9F%BA%E6%9C%AC%E8%B5%84%E6%96%99&value={userid}'
proxy配置

使用socks需安装 :pip install -U ‘requests[socks]’

    def _proxy(self):
        """
        调用
        :return:
        """
        # 判断IP是否过期
        new_time = datetime.datetime.now()
        if self.expire_time and new_time < datetime.datetime.strptime(self.expire_time, "%Y-%m-%d %H:%M:%S"
  • 24
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

网络爬虫大揭秘

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值