网络爬虫
wilsonyun
这个作者很懒,什么都没留下…
展开
-
《Python3网络爬虫开发实战》笔记 第1章 开发环境配置
这章主要是为网络爬虫做准备,配置一个开发环境, 为了方便,操作系统为Windows 1.1 安装Python3 主要安装Anaconda 3 64bit 1.2 请求库安装 (浏览器方面) 爬虫可以分为简单几步: 抓取页面,分析页面和存储数据。 requests库: 在抓取页面过程中,我们需要模拟浏览器向服务器发出请求。 安装方法:...原创 2018-12-05 17:08:29 · 518 阅读 · 0 评论 -
《Python3网络爬虫开发实战》笔记 第2章 爬虫基础
搞了一大轮环境配置,终于开始学习爬虫的基础知识了! 2.1、 HTTP基本原理 URI: Uniform Resource Identifier 统一资源标志符 URL: Universal Resource Locatior 统一资源定位符 URL是URI的子集,,每个URL都是URI,但不是每个URI都是URL。URI还包括...原创 2018-12-11 17:01:47 · 219 阅读 · 0 评论