爬虫基础01

最新推荐文章于 2024-09-08 22:15:11 发布

Ronin__L

最新推荐文章于 2024-09-08 22:15:11 发布

阅读量110

点赞数

分类专栏：爬虫文章标签：爬虫数据采集模拟浏览器 HTTP协议信息抓取

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Ronin__L/article/details/115615145

版权

爬虫专栏收录该内容

9 篇文章 0 订阅

订阅专栏

爬虫基础01

文章目录

爬虫基础01
一、爬虫的概念
二、爬虫的作用
三、爬虫的分类
四、爬虫的流程

一、爬虫的概念

网络爬虫(又被称为网页蜘蛛，网络机器人)就是模拟客户端(主要指浏览器)发送网络请求，接收请
求响成，一种按照-定的规则，自动地抓取互联网信息的程序。
●原则上，只要是客户端(浏览器)能做的事情，爬虫都能够做
●爬虫也只能获取客户端(浏览器)所展示出来的数据
模拟浏览器，发送请求，获取响应

二、爬虫的作用

●数据采集
●软件测试
●抢票
●网站上的投票
●网络安全

三、爬虫的分类

在这里插入图片描述

四、爬虫的流程

在这里插入图片描述

1.获取一个url
2.向url发送请求，并获取响应(需要http协议)
3.如果从响应中提取ur),则继续发送请求获取响应
4.如果从响应中提取数据，则将数据进行保存

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫基础01

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章 Python 机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。