送书 | 《Python3爬虫实战——数据清洗、数据分析与可视化》

又到了每周三的送书时刻啦!今天给大家带来的是《Python3爬虫实战——数据清洗、数据分析与可视化

      (文末查看送书规则)

内容简介

作为一个自学爬虫的过来人,曾经走过很多弯路,在自学的道路上也迷茫过。每次面对一个全新的网站,都像是踏进一个未知的世界。你不知道前面有哪些反爬手段在等着你;你不知道你会踩进哪个坑里。我做爬虫的几年时间里,爬过很多的网站、遇到过很多的难题。这本书就是我这几年经验的总结,从开始的工具的学习使用,到实战项目的爬取,难度一步一步的升级,需求也越来越复杂,有各式各样的爬取方式。

本书主要内容与数据爬取相关,包括编写爬虫所需要的基础编程知识,如Requests包、Scrapy框架和数据库的使用,到项目实战教程,适合Python基础入门的读者。如果你是其他行业的从业者,想进入IT行业成为一位爬虫工程师,又或者你已经是IT行业的从业者,本书在能够让你在对爬虫工程师的工作内容有所了解的同时,也能让你掌握作为一个爬虫工程师所需要具备的基础技能。

作者简介

姚良 2016-2019 深圳丝路天地电子商务有限公司 爬虫工程师。熟练使用Python语法,面向对象编程,JS破解、分布式爬虫、Scrapy框架、Requests库、Redis、Mongodb、高并发、异步编程。

本书适合人群

Python初学者,数据分析师,金融证券从业人员,编程爱好者,大数据从业人员,创业公司老板等。

目录

第一篇 基础知识

第1章 Python环境搭建

第2章 常用爬虫库Requests

第3章 常用爬虫框架Scrapy

第4章 数据存储——数据库的选择

第5章 效率为王——分布式爬虫

第6章 抓包的使用与分析=

第7章 Websocket通信网站爬取

第8章 验证码破解

第9章 多线程与多进程并发爬取

第10章 爬虫接口优化

第11章 使用Docker部署爬虫

第二篇 实战案例

第12章 实战1:建立代理IP池

第13章 实战2:磁力链接搜索器

第14章 实战3:爬虫管家

第15章 实战4:数据可视化

第16章 实战5:爬取贴吧中的邮箱

第17章 实战6:批量爬取企业信息

第18章 实战7:爬取公众号历史文章

第19章 实战8:高效爬取——异步爬虫

第20章 实战9:爬取漫画网站

第21章 实战10:给kindle推送爬取的小说

第22章 实战11:爬取游民星空壁纸

第23章 综合实战:建立一个小网站

有粉丝想更多了解此书,请点击下面链接:

送书规则

公众号回复:送书 ,参与抽奖(共5本)

本次送书5本

或者扫一扫下方的二维码回复:送书  即可!


  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值