Beautifulsoup爬取网页标题

本文档通过实例代码介绍了如何使用BeautifulSoup库爬取指定网页的标题,详细步骤包括发送请求、解析网页、提取标题信息,并将结果保存到txt文件。
摘要由CSDN通过智能技术生成

既然是使用BeautifulSoup我们就来爬取BeautifulSoup官方文档的标题吧。也就是下面红框内的图片。网址:https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/#id4
在这里插入图片描述
接下来我们进行分步处理:
①请求数据:

r=requests.get("https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/#id4")
text=r.text 

②利用Beautifulsoup获取网页信息:

soup=BeautifulSoup(text,"html.parser")

③提取网页中自己想要的信息:

a = soup.find('div',{'class':'local-toc'}).find_all('a',{'class':'reference internal'})

④将提取导的信息放入到一个列表中:

b = []
for i in range(len(a)):  		#放入列表中
	b.append(a[i].get_text())

⑤将列表中的数据放入txt文件中

with open(r'C:\U
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值