初识爬虫1

菜鸡中的奋斗鸡→挣扎鸡

已于 2024-09-10 17:08:07 修改

阅读量387

点赞数 7

文章标签：爬虫

于 2024-09-10 15:13:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_77869606/article/details/142098845

版权

学习路线：爬虫基础知识-requests模块-数据提取-selenium-反爬与反反爬-MongoDB数据库-scrapy-appium。

对应视频链接(百度网盘)：正在整理中

爬虫基础知识：

1.爬虫的概念

总结：模拟浏览器，发送请求，获取响应。
2.爬虫的作用
        数据采集
        软件测试
        抢票
        网站上的投票
        网络安全
3.爬虫的分类
        数量
        是否获取数据
        url与数据的关系

4.爬虫的流程
        url
        发请求，获取响应
        解析

5.http复习
        http以及https的概念和区别
        HTTPSH比HTTP更安全，但是性能更低
6.常见的请求头与响应头
请求头
host                                         域名
Connection                                     长连接
Upgrade-Insecure-Requests 升级为HTTPS请求
***User-Agent                                 用户代理，提供系统信息和浏览器信息
***Referer 页面跳转处，防盗链(图片/视频)
***Cookie 状态保持
响应头 Set-Cookie
7.状态码
所有的状态码都不可信，一切以是否从抓包得到的响应中获取到数据为准
network中抓包得到的源码才是判断依据，elements中的源码是渲染之后的源码

8.浏览器请求的过程
发送所有请求，进行渲染
爬虫
只发送指定请求，不会渲染

骨骼文件：html静态文件
肌肉文件：js/ajax请求
皮肤：css/font/图片

源代码控制台所有源代码响应

Network：点刷新，可以看到响应

菜鸡中的奋斗鸡→挣扎鸡

关注

7
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
初识爬虫1

**Referer 页面跳转处，防盗链(图片/视频)***User-Agent 用户代理，提供系统信息和浏览器信息。network中抓包得到的源码才是判断依据，elements中的源码是渲染之后的源码。所有的状态码都不可信，一切以是否从抓包得到的响应中获取到数据为准。只发送指定请求，不会渲染。总结：模拟浏览器，发送请求，获取响应。发送所有请求，进行渲染。
复制链接

扫一扫

菜鸡中的奋斗鸡→挣扎鸡 CSDN认证博客专家 CSDN认证企业博客

码龄1年

67: 原创

1万+: 周排名

3万+: 总排名

2万+: 访问

: 等级

1076: 积分

237: 粉丝

404: 获赞

12: 评论

161: 收藏

私信

关注

热门文章

最新评论

pdf查看密码
菜鸡中的奋斗鸡→挣扎鸡: 不行的，推荐去用ARCHPR工具
pdf查看密码
m0_67875232: 解压密码可以用这个弄吗？
大数处理
CSDN-Ada助手: Java 技能树或许可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
小红的ABC
CSDN-Ada助手: 恭喜您写下了第17篇博客，“小红的ABC”！持续创作不易，您的坚持和努力让我十分钦佩。希望您能继续分享您的心得体会和见解，或许可以尝试探索一些新的主题或写作风格，给读者带来更多的惊喜和启发。谢谢您的分享，期待您更多精彩的作品！
整数拆分
CSDN-Ada助手: 恭喜您写了第11篇博客！看到您不断分享关于整数拆分的内容，真是让人佩服。接下来，我建议您可以尝试探讨一些更深入的整数拆分算法或者应用场景，或者分享一些实用的整数拆分技巧，这样可以为读者提供更多有价值的信息。期待您的下一篇作品！加油！

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。