爬虫的基本流程

April123abc

于 2023-11-21 23:24:33 发布

阅读量615

点赞数

文章标签：爬虫 python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/April123abc/article/details/134542552

版权

作用：批量爬取web网页上的数据

原理：正常用户访问服务器

正常用户 ---> 发送请求 ---->服务器 ----> 响应数据 ---->用户

爬虫模拟正常用户

注意: 所有的数据都能爬吗？所见皆可爬，但是要合法

注意空值爬虫的频率问题

应用：大数据和人工智能

智能安防：产生视频

人脸识别：打拐

爬虫的分类：通用爬虫和聚焦爬虫

爬虫的基本流程：

1.导入requests模块

1）安装 pip install requests,

换源安装 pip install requests -i Simple Index

pycharm安装第三方库快捷键 Alt + Enter

导入 import requests

2) 查看网页静态加载还是动态加载

查看网页源代码---> Ctrl+F ----> 输入词组 ---> 判断动态还是静态，有的话是静态，没有的话是动态

2.确定url地址

右键检查--network--刷新--response找到需要的内容--headers里面的url就是我们要找的url

url = '百度一下，你就知道'

3.发送请求-获取数据

res = requests.get(url=url)

print(res)

详细代码如下

import requests

url = 'https://www.baidu.com/'

res = requests.get(url=url)
print(res)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫的基本流程

作用：批量爬取web网页上的数据原理：正常用户访问服务器正常用户 ---> 发送请求 ---->服务器 ----> 响应数据 ---->用户爬虫模拟正常用户注意: 所有的数据都能爬吗？所见皆可爬，但是要合法注意空值爬虫的频率问题应用：大数据和人工智能智能安防：产生视频人脸识别：打拐爬虫的分类：通用爬虫和聚焦爬虫。
复制链接

扫一扫

April123abc CSDN认证博客专家 CSDN认证企业博客

码龄1年

25: 原创

124万+: 周排名

20万+: 总排名

2万+: 访问

: 等级

654: 积分

285: 粉丝

393: 获赞

8: 评论

396: 收藏

私信

关注

热门文章

分类专栏

爬虫 1篇

最新评论

Djiango 4. 模板基础与orm
CSDN-Ada助手: 恭喜你写了第19篇博客！学习了Djiango模板基础与orm的内容后，我觉得你对这方面的知识已经有了很深入的理解。不过，我个人认为在接下来的创作中，可以尝试结合实际案例或者更多的实践经验，让读者更容易理解和运用这些知识。希望你能继续保持创作的热情，期待你更多精彩的分享！
django 5. orm与模型进阶
CSDN-Ada助手: 恭喜作者第20篇博客的发布，标题听起来非常吸引人！对于django的orm与模型进阶，我相信你一定深入了解并有所总结。希望你可以继续分享更多关于django的知识，也可以考虑结合实际案例进行分析，让读者更易于理解和应用。期待你的下一篇作品！
A股票实时数据分析
CSDN-Ada助手: 恭喜您撰写了第15篇博客！题为“A股票实时数据分析”的博文听起来非常有趣和有用。您对A股票的实时数据进行分析，无疑为投资者提供了重要的参考和决策依据。我深感您的努力和专注，并衷心期待您未来更多的创作。在下一步的创作中，或许您可以考虑将更多实用的技巧和策略融入到A股票实时数据分析中。这样，读者不仅能够了解数据的背后含义，还能通过您的指导更好地运用这些数据。当然，这只是一个建议，希望能对您有所启发。再次恭喜您，期待您继续分享有价值的知识与见解！
决策树算法
CSDN-Ada助手: 恭喜您写了第13篇博客！标题“决策树算法”听起来非常有趣。您对这个主题的深入探讨无疑会吸引很多读者的关注。我很期待阅读您的博客，并了解更多关于决策树算法的知识。在您的下一篇博客中，我想建议您可以进一步探讨决策树算法的应用场景，例如在数据挖掘、机器学习中的实际应用。这样的话，读者们可以更好地理解决策树算法的实用性和价值。同时，如果您能够分享一些实际案例或者提供一些实际操作的指导，相信读者们会更加受益。再次恭喜您的持续创作，期待您的下一篇博客！希望您能继续保持谦虚的态度，与读者们分享更多有价值的知识。
Pandas入门
CSDN-Ada助手: 恭喜作者的第9篇博客“Pandas入门”发布！看到你持续不断地创作，真的很让人佩服。希望你可以继续分享更多关于Pandas的知识，或者可以考虑深入一些高级的应用技巧，让读者们受益匪浅。谢谢你的分享，期待你更多的精彩内容！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。