【Python】【爬虫】网页页面内容解析（2）

最新推荐文章于 2024-09-16 14:49:33 发布

Ls-CC

最新推荐文章于 2024-09-16 14:49:33 发布

阅读量122

点赞数 2

分类专栏：爬虫文章标签： python 爬虫开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45404464/article/details/140451854

版权

爬虫专栏收录该内容

3 篇文章 0 订阅

订阅专栏

#库导入
from bs4 import BeautifulSoup
import requests

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)"}  #伪装成浏览器，防止请求失败
content = requests.get("http://books.toscrape.com/", headers = headers).text    #获取指定网页源码

soup = BeautifulSoup(content,"html.parser") #网页源码解析
all_titles = soup.findAll("h3") #获取所有包含h3元素的内容

for title in all_titles:    #for循环获取所有书籍标题
    all_links = title.findAll("a")  #获取所有包含<a>*</a>的元素
    for link in all_links:  #循环打印
        print(link.string)

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Ls-CC CSDN认证博客专家 CSDN认证企业博客

码龄5年

19: 原创

117万+: 周排名

13万+: 总排名

5073: 访问

: 等级

260: 积分

35: 粉丝

70: 获赞

8: 评论

38: 收藏

私信

关注

热门文章

分类专栏

爬虫 3篇
Tkinter 4篇
Java 2篇
C 1篇
算法 1篇
数学 1篇
Python快速入门 3篇

最新评论

【Python】【爬虫】网页页面内容解析（2）
Ls-CC: 另一种解决办法
【Python】【爬虫】网页页面内容解析（2）
Ls-CC: [code=python] #库导入 from bs4 import BeautifulSoup import requests headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)"} #伪装成浏览器，防止请求失败 content = requests.get("http://books.toscrape.com/", headers = headers).text #获取网页内容 soup = BeautifulSoup(content, "html.parser") #网页内容解析 all_titles = soup.findAll("h3") #获取所有包含<h3>*</h3>的内容 for title in all_titles: #for循环 link = title.find("a") #获取所有包含<a *>*</a>的内容 print(link.string) #打印 [/code]
【Python】【爬虫】网页内容获取
Ls-CC: 豆瓣TOP250网页源码爬取
【Python】【爬虫】网页内容获取
Ls-CC: [code=python] import requests #requests库引入 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)"} #伪装成浏览器，防止请求失败 response = requests.get("https://movie.douban.com/top250", headers = headers) #获取网页内容 if response.ok: #请求成功 print(response.text) #打印网页内容 else: #请求失败 print("请求失败！") #提示请求失败 [/code]
【Python】【PyStray】托盘图标中的菜单弹出
Ls-CC: PyStray官方帮助文档：https://pystray.readthedocs.io/en/latest/usage.html#creating-the-menu Github项目地址：https://github.com/moses-palmer/pystray

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。