用爬虫获取百度热搜

最新推荐文章于 2024-05-27 16:30:19 发布

lxdhwz

最新推荐文章于 2024-05-27 16:30:19 发布

阅读量1k

点赞数

分类专栏： python 文章标签： python 爬虫

本文链接：https://blog.csdn.net/lxdhwz/article/details/118312737

版权

本文介绍了如何利用Python编写爬虫程序，从百度网站抓取实时的热搜榜数据，掌握网络热门话题。

摘要由CSDN通过智能技术生成

用爬虫获取百度热搜

import requests
from bs4 import BeautifulSoup
from openpyxl import Workbook
def getHtml():
    # 获取网页源码
    headers={
   "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36 SLBrowser/7.0.0.5211 SLBChan/103"}
    html=requests.get("https://top.baidu.com/board?tab=realtime",headers=headers)
    html.encoding=html.apparent_encoding #获取原本网站发个你的编码然后堆上去
    return html.text
# 处理源码想要的数据
def getContent():</

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

lxdhwz

关注关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
用爬虫获取百度热搜

用爬虫获取百度热搜import requestsfrom bs4 import BeautifulSoupfrom openpyxl import Workbookdef getHtml(): # 获取网页源码 headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36 SLBr
复制链接

扫一扫