【Python】【爬虫】网页页面内容解析（1）

Ls-CC

于 2024-07-15 22:15:05 发布

阅读量114

点赞数

分类专栏：爬虫文章标签： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45404464/article/details/140450640

版权

爬虫专栏收录该内容

3 篇文章 0 订阅

订阅专栏

#库引入
from bs4 import BeautifulSoup
import requests

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)"}  #伪装成浏览器，防止请求失败
content = requests.get("http://books.toscrape.com/", headers = headers).text    #获取网页源码
soup = BeautifulSoup(content, "html.parser")    #源码解析
all_prices = soup.findAll("p", attrs={"class": "price_color"})  #标签解析，只要在<p>*</p>中包含"class price_color"的内容
for price in all_prices:    #循环函数，打印内容
    print(price.string[2:]) #切片操作，获取大于等于2的所有内容

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【Python】【爬虫】网页页面内容解析（1）

【代码】【Python】【爬虫】网页页面内容解析（1）
复制链接

扫一扫

专栏目录

Ls-CC CSDN认证博客专家 CSDN认证企业博客

码龄5年

18: 原创

38万+: 周排名

11万+: 总排名

4279: 访问

: 等级

244: 积分

35: 粉丝

64: 获赞

8: 评论

38: 收藏

私信

关注

热门文章

分类专栏

爬虫 3篇
Tkinter 4篇
Java 2篇
C 1篇
算法 1篇
数学 1篇
Python快速入门 3篇

最新评论

【Python】【爬虫】网页页面内容解析（2）
Ls-CC: 另一种解决办法
【Python】【爬虫】网页页面内容解析（2）
Ls-CC: [code=python] #库导入 from bs4 import BeautifulSoup import requests headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)"} #伪装成浏览器，防止请求失败 content = requests.get("http://books.toscrape.com/", headers = headers).text #获取网页内容 soup = BeautifulSoup(content, "html.parser") #网页内容解析 all_titles = soup.findAll("h3") #获取所有包含<h3>*</h3>的内容 for title in all_titles: #for循环 link = title.find("a") #获取所有包含<a *>*</a>的内容 print(link.string) #打印 [/code]
【Python】【爬虫】网页内容获取
Ls-CC: 豆瓣TOP250网页源码爬取
【Python】【爬虫】网页内容获取
Ls-CC: [code=python] import requests #requests库引入 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)"} #伪装成浏览器，防止请求失败 response = requests.get("https://movie.douban.com/top250", headers = headers) #获取网页内容 if response.ok: #请求成功 print(response.text) #打印网页内容 else: #请求失败 print("请求失败！") #提示请求失败 [/code]
【Python】【PyStray】托盘图标中的菜单弹出
Ls-CC: PyStray官方帮助文档：https://pystray.readthedocs.io/en/latest/usage.html#creating-the-menu Github项目地址：https://github.com/moses-palmer/pystray

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。