我是一只小小爬虫(Python编程)--第1节 什么是爬虫
一、爬虫的基本概念爬虫:一只在网络上爬行的“蜘蛛”,这只蜘蛛用来在网络上爬取我们想获取的信息,所以爬虫的定义大概是:
请求网站并提取数据的自动化程序。
从定义中可以看出,我们首先要做的是向网站发送请求,模拟浏览器浏览网页的模式,从而获取数据,此时获取的数据其实是html代码文本以及图片等,接下来就是筛选我们需要的数据,梳理好我们需要的数据之后,就是要分类,按需存储我们的想要的数据,这就是一只爬虫
原创
2017-12-30 22:44:10 ·
520 阅读 ·
0 评论