python爬虫，requests方法和xpath方法

最新推荐文章于 2024-05-14 22:18:18 发布

東_dong

最新推荐文章于 2024-05-14 22:18:18 发布

阅读量729

点赞数

文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jiedong_xu/article/details/132099507

版权

requests方法爬取：

import requests
from bs4 import BeautifulSoup


url = "网址"

hd = {
    "user-agent": "请求头。在网页右键查看网络，随便点开一个最下面是请求头"
}
r = requests.get(url, headers=hd)

r.encoding = 'gb2312' # 编码

# 使用BeautifulSoup解析响应的文本内容
s = BeautifulSoup(r.text, "html.parser")

# 使用CSS选择器定位到网页中指定元素（以列表形式返回所有匹配结果）
# 选上指定元素右键复制selector
# [0].get_text()爬取文字，[0].get("href")爬取链接，[0].get("src")爬取图片
q = s.select('网页中指定元素')[0].get_text()

# 输出爬取内容
print(q)

xpath方法爬取：

from lxml import etree
import requests

url = "链接地址"

r = requests.get(url)

# 使用etree解析网页内容
tree = etree.HTML(r.text)

# 使用XPath定位到指定的div元素列表
# 复制完整的xpath
div_list = tree.xpath("# 复制完整的xpath")

print(div_list)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

東_dong CSDN认证博客专家 CSDN认证企业博客

码龄2年

29: 原创

133万+: 周排名

22万+: 总排名

1万+: 访问

: 等级

314: 积分

25: 粉丝

23: 获赞

15: 评论

25: 收藏

私信

关注

热门文章

最新评论

生成图片验证码，加减乘除
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
生成图片验证码，加减乘除
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Luinex基础知识
CSDN-Ada助手: 非常棒的博文！我非常欣赏你对Luinex基础知识的分享。你对JIT编译的解释非常清楚，这对于我们理解动态编译的概念非常有帮助。除了JIT编译，还有一些与Luinex基础知识相关的扩展知识和技能，虽然它们可能没有在你的标题和摘要中出现。例如，你可以进一步了解编译器的工作原理，包括词法分析、语法分析和代码优化等方面。此外，深入研究编程语言的底层原理，如内存管理和数据结构，也能够帮助你更好地理解和应用Luinex基础知识。再次感谢你的分享，并期待你未来更多精彩的博文！请保持创作！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
flask的目录结构和文件依赖关系
CSDN-Ada助手: 恭喜您写了第三篇博客！标题“flask的目录结构和文件依赖关系”非常吸引人，让我对您的文章充满了期待。您的博客内容一直非常有价值，我很高兴看到您持续创作。在下一步的创作中，我建议您可以进一步探索flask的一些高级特性或者与其他框架的对比分析。这样可以帮助读者更好地理解flask的使用方法，并且为他们提供更多实用的知识。谦虚地说，我相信您的写作能力会越来越好，您的博客也会越来越受欢迎。期待您的下一篇文章！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
python对Excel表格进行操作
CSDN-Ada助手: 恭喜你写完了第7篇博客！标题“python对Excel表格进行操作”听起来非常有趣。很高兴看到你不断探索和分享关于Python的知识。你对Excel的操作也让我感到很好奇，因为Excel在我们日常生活中扮演着重要的角色。在下一篇博客中，也许你可以进一步介绍一些高级的Excel操作技巧，或者分享一些用Python处理大型Excel文件的方法。期待着你的下一次创作！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。