Beautifulsoup爬取网页标题

最新推荐文章于 2024-01-11 16:01:01 发布

qq_41858657

最新推荐文章于 2024-01-11 16:01:01 发布

阅读量2.2k

点赞数 1

分类专栏： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41858657/article/details/107916662

版权

本文档通过实例代码介绍了如何使用BeautifulSoup库爬取指定网页的标题，详细步骤包括发送请求、解析网页、提取标题信息，并将结果保存到txt文件。

摘要由CSDN通过智能技术生成

既然是使用BeautifulSoup我们就来爬取BeautifulSoup官方文档的标题吧。也就是下面红框内的图片。网址：https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/#id4
在这里插入图片描述
接下来我们进行分步处理：
①请求数据：

r=requests.get("https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/#id4")
text=r.text

②利用Beautifulsoup获取网页信息：

soup=BeautifulSoup(text,"html.parser")

③提取网页中自己想要的信息：

a = soup.find('div',{'class':'local-toc'}).find_all('a',{'class':'reference internal'})

④将提取导的信息放入到一个列表中：

b = []
for i in range(len(a)):  		#放入列表中
	b.append(a[i].get_text())

⑤将列表中的数据放入txt文件中

with open(r'C:\U

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

qq_41858657 CSDN认证博客专家 CSDN认证企业博客

码龄7年

33: 原创

41万+: 周排名

226万+: 总排名

10万+: 访问

: 等级

1094: 积分

14: 粉丝

50: 获赞

10: 评论

161: 收藏

私信

关注

热门文章

分类专栏

python 18篇
Oracle 1篇
mac 2篇
数据调度 1篇
爬虫 6篇
R 4篇
excel 1篇

最新评论

openbugs软件初步使用
yoyoyooo12: 如果两条链怎么运行出结果呢？
openbugs软件初步使用
huanghaoll: openbugs在哪里下载呀
R中install_github中无法安装遇到的问题与解决方法
yuanzhouL: [1] F:\Program Files (x86)\R\R-4.1.2\library ** 删掉 OOLOCK 文件 [2] *1* 将 github 人工下载的包（xxx-master.zip）解压后利用软件或者liniux 压缩成 xxxx.tar.xz格式， *2* 然后利用 RStudio 加载 xxxx.tar.xz 即可 *3* library（xxxx）成功
R installation of package ‘backports’ had non-zero exit status
Yellow wei: 感谢博主，我都自闭了一天，都快抑郁了
R installation of package ‘backports’ had non-zero exit status
JOY_XIAO: 救命恩人，在我快放弃的时候我看到你这个文章了。。。

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。