一、综 述
首先,本小节主要讲述一下网络爬虫的概念以及接下来的计划安排。
1.概念:所谓网络爬虫和信息提取,说白了就是掌握定量的网络数据爬取和网页解析能力
2.计划
Requests库 | 自动爬取HTML页面,自动网络请求提交 |
robots.txt | 网络爬虫排除标准 |
Beautiful Soup | 解析HTML页面 |
Re | 正则表达式详解,提取页面相关信息 |
Project | 项目实战 |
Scrapy | 网络爬虫原理介绍 / 专业爬虫框架介绍 |
首先,本小节主要讲述一下网络爬虫的概念以及接下来的计划安排。
1.概念:所谓网络爬虫和信息提取,说白了就是掌握定量的网络数据爬取和网页解析能力
2.计划
Requests库 | 自动爬取HTML页面,自动网络请求提交 |
robots.txt | 网络爬虫排除标准 |
Beautiful Soup | 解析HTML页面 |
Re | 正则表达式详解,提取页面相关信息 |
Project | 项目实战 |
Scrapy | 网络爬虫原理介绍 / 专业爬虫框架介绍 |