Python3 学习过程-爬虫示例-抓取热榜

最新推荐文章于 2024-07-27 22:38:21 发布

vicdream

最新推荐文章于 2024-07-27 22:38:21 发布

阅读量373

点赞数

分类专栏： Python3 学习过程文章标签： python

本文链接：https://blog.csdn.net/u011832614/article/details/119080386

版权

本文记录了使用Python3进行网络爬虫的学习过程，以抓取头条热榜为例，包括打开页面，分析请求URL，定位内容标签，以及编写抓取代码的详细步骤。

摘要由CSDN通过智能技术生成

实现一个简单的爬虫，此处以抓取头条热榜为例，记录学习过程。

一、使用浏览器打开头条热榜页面

二、打开开发者工具，找到请求内容url

三、在页面，右键查看源码，找到要获取的内容标签

四、编写抓取代码

#爬虫demo 实现 抓取头条排行榜
#引入请求访问组件
import requests
#引入html解析组件
from bs4 import BeautifulSoup
#添加请求头
kv = {'user-agent': 'Mozilla/5.0'}
#请求头条热榜
response = requests.get('https://tophub.today/n/x9ozB4KoXb',headers=kv)
#获取请求结果并转换为html
soup = BeautifulSoup(response.text, 'html.parser')
#获取标签为td,class 属性为al的所有标签
tdList=soup.find_all('td',attrs={"class": "al"})

#输出标签内容
for td in tdList:
    print("排名"+str((tdList.index(td) + 1)), td.get_text())

vicdream

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python3 学习过程-爬虫示例-抓取热榜

实现一个简单的爬虫，此处以抓取头条热榜为例，仅为学习。一、使用浏览器打开头条热榜页面二、打开开发者工具，找到请求内容url三、在页面，右键查看源码，找到要获取的内容标签四、编写抓取代码#爬虫demo 实现抓取头条排行榜#引入请求访问组件import requests#引入html解析组件from bs4 import BeautifulSoup#添加请求头kv = {'user-agent': 'Mozilla/5.0'}#请求头条热榜re...
复制链接

扫一扫