简单拿捏python的beautifulsoup库--爬取数据

最新推荐文章于 2023-09-21 10:07:20 发布

是小橙呀

最新推荐文章于 2023-09-21 10:07:20 发布

阅读量734

点赞数

文章标签： python 爬虫数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/calmlion01/article/details/122052746

版权

前言：

beautifulsoup库也叫美味汤。好东西，是一个优秀的第三方库。

用来干嘛：

一般我们用来对html，xml文件进行解析

安装不做赘述。（实在不会就在设置里添加bs4、beautifulsoup的库）

接下来，直接开干。

首先，要解析html文件，我们需要有html作为soup汤的原料。

我们用request库（得安装这个库）获取原料

import requests


r = requests.get('https://python123.io/ws/demo.html')
print r.text

简简单单三行代码，拿下原料。第一句导入request库。第二句爬取网址的html代码。第三句打印出来。

demo=r.text
from bs4 import BeautifulSoup
soup=BeautifulSoup(demo,"html.parser")

demo放原料，

"html.parser"为解析器，照着打就行。

 最后敲上print(soup.prettify())即可解析html代码

此外，还可以利用beautifulsoup打印一些属性、标签等如

print (soup.title)
# print  soup.a.name
# print soup.a.parent.name
# print soup .a.parent.parent.name//标签
tag = soup.a
print tag.attrs
print tag.attrs['class']
print tag.attrs['href']

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
简单拿捏python的beautifulsoup库--爬取数据

前言：beautifulsoup库也叫美味汤。好东西，是一个优秀的第三方库。用来干嘛：一般我们用来对html，xml文件进行解析安装不做赘述。（实在不会就在设置里添加bs4、beautifulsoup的库）接下来，直接开干。首先，要解析html文件，我们需要有html作为soup汤的原料。我们用request库（得安装这个库）获取原料import requestsr = requests.get('https://python123.io/ws/demo.html')
复制链接

扫一扫

是小橙呀 CSDN认证博客专家 CSDN认证企业博客

码龄4年

4: 原创

118万+: 周排名

33万+: 总排名

3万+: 访问

: 等级

67: 积分

12: 粉丝

23: 获赞

4: 评论

210: 收藏

私信

关注

热门文章

分类专栏

遥感envi 1篇

最新评论

地统计分析原理（空间插值）-协方差与半变异--（下）
CSDN-Ada助手: 非常感谢博主分享地统计分析原理（空间插值）的知识，这篇博客让我更深入了解了协方差与半变异的概念。我觉得博主可以在下一篇博客中继续探讨一下空间插值的方法和应用，例如：基于Kriging插值法的地形分析和地下水位预测等方面，这样的技术文章对其他用户也会非常有帮助。相信博主的下一篇博客会有更多读者期待哦。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
监督和非监督分类及后处理过程全过程（超详细带解读）
七里贼香: 哇，和老师的题一模一样诶，师兄好棒，师兄好强！
简单拿捏python的beautifulsoup库--爬取数据
ζั͡ޓއއ星辰: 博主的东西很实用，用完已经挂科了
监督和非监督分类及后处理过程全过程（超详细带解读）
ζั͡ޓއއ星辰: giegie的博客我好爱

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

是小橙呀 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。