一、什么是爬虫
网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或者脚本。由于互联网数据的多样性和资源的有限性,根据用户需求定向抓取相关网页并分析已成为如今主流的爬取策略。
二、爬虫可以做什么
爬取浏览器上的数据
三、爬虫的本质
模拟浏览器打开网页,获取网页中我们想要的那部分数据。
网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或者脚本。由于互联网数据的多样性和资源的有限性,根据用户需求定向抓取相关网页并分析已成为如今主流的爬取策略。
爬取浏览器上的数据
模拟浏览器打开网页,获取网页中我们想要的那部分数据。