用requests的get方法获取网站的标题、网址（简单）

年糕瓤

已于 2022-10-12 13:15:48 修改

阅读量1.1k

点赞数

分类专栏：爬虫文章标签：爬虫

于 2022-10-11 19:44:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ykudingcha/article/details/127270076

版权

爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

网页源代码如下（2022.10.11）：

找到目标所在的父标签、子标签后，实现代码

代码如下：

#导出bs4，requests库

import bs4,requests

#伪装请求头
headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36'}

#编辑url网址

url='http://bbs.tianya.cn/list-funinfo-1.shtml'

#requests.get()方法

res=requests.get(url,headers=headers)

#利用BeatifulSoup方法
info_1=bs4.BeautifulSoup(res.text,'html.parser')

#利用BeautifulSoup的find.all()，并写上标签‘tr’，和属性class_和属性值‘bg’
info_2=info_1.find_all('tr',class_="bg")

#利用循环取值
for info_3 in info_2:

#用find（）里面写上标签‘a’
info_4=info_3.find('a')

#输出text格式，并用strip()去掉空格
print(info_4.text.strip())

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
用requests的get方法获取网站的标题、网址（简单）

利用BeautifulSoup的find.all()，requests库。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。