利用Python对百度今日热点事件排行榜关键词的爬取

本文介绍了如何使用Python进行网络爬虫,抓取百度的今日热点事件排行榜上的关键词,通过示例代码展示了具体的实现过程。
摘要由CSDN通过智能技术生成

百度今日热点事件排行榜URL今日热点事件排行榜

代码:

#CrawBaiduTop.py
import requests
from bs4 import BeautifulSoup
import bs4

tops = []                                                                   #创建空列表,用于储存词条
url = 'http://top.baidu.com/buzz?b=341&c=513&fr=topbuzz_b1_c513'
r = requests.get(url, timeout=40)                                           #获得url信息,设置40秒超时时间
r.raise_for_status()                                                        #失败请求(非200响应)抛出异常
r.encoding = r.apparent_encoding                                            #根据内容分析出的编码方式,备选编码;
html = r.text  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值