爬取热搜排行榜数据(以微博为例)再保存数据库用的是selenium

本文介绍如何使用selenium爬取微博热搜排行榜数据,并将其存储到数据库中。涉及第三方库安装、URL确定、请求发送、数据库连接及数据写入等步骤。
摘要由CSDN通过智能技术生成

爬取热搜排行榜数据(以微博为例)再保存数据库

  • [1] 下载好所需要的第三方库
  • [2] 先确定要爬取的url
  • [3] 开始我们的请求数据
  • [4] 确保数据库的正常连接输送
  • [5] 保存进自己的数据库
    好了,大概就是以上五点。

第一点:第三方库的安装,

需要准备`
import requests

from selenium.webdriver import Chrome,ChromeOptions

import time
import pymysql
import traceback`
就上面的五个包就足够了。
可以看我的上一篇博客,有安装教程,这里我就不详细谢啦,附一下上篇连接https://blog.csdn.net/XY52wiue/article/details/112975003
下面开始我们的实际操作。

第二步,确定要爬取的url

url = https://s.weibo.com/top/summary

打开技术这个样子,当然你也可以换网站,其实都一样的啦。在这里插入图片描述

第三步,发送请求啦

先粘贴下代码吧各位,少安毋躁呀

def get_webhot():   #热搜函数
    url ="https://s.weibo.com/top/summary"  # 微博的地址

    res = requests.get(url)
    #这个就是再后台上面运行那个浏览器,不在表面上占用你的
    option = ChromeOptions()
    option.add_argument('--headless')
 
  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值