又到了每周三的送书时刻啦!今天给大家带来的是《Python3爬虫实战——数据清洗、数据分析与可视化》
(文末查看送书规则)
内容简介
作为一个自学爬虫的过来人,曾经走过很多弯路,在自学的道路上也迷茫过。每次面对一个全新的网站,都像是踏进一个未知的世界。你不知道前面有哪些反爬手段在等着你;你不知道你会踩进哪个坑里。我做爬虫的几年时间里,爬过很多的网站、遇到过很多的难题。这本书就是我这几年经验的总结,从开始的工具的学习使用,到实战项目的爬取,难度一步一步的升级,需求也越来越复杂,有各式各样的爬取方式。
本书主要内容与数据爬取相关,包括编写爬虫所需要的基础编程知识,如Requests包、Scrapy框架和数据库的使用,到项目实战教程,适合Python基础入门的读者。如果你是其他行业的从业者,想进入IT行业成为一位爬虫工程师,又或者你已经是IT行业的从业者,本书在能够让你在对爬虫工程师的工作内容有所了解的同时,也能让你掌握作为一个爬虫工程师所需要具备的基础技能。
作者简介
姚良 2016-2019 深圳丝路天地电子商务有限公司 爬虫工程师。熟练使用Python语法,面向对象编程,JS破解、分布式爬虫、Scrapy框架、Requests库、Redis、Mongodb、高并发、异步编程。
本书适合人群
Python初学者,数据分析师,金融证券从业人员,编程爱好者,大数据从业人员,创业公司老板等。
目录
第一篇 基础知识
第1章 Python环境搭建
第2章 常用爬虫库Requests
第3章 常用爬虫框架Scrapy
第4章 数据存储——数据库的选择
第5章 效率为王——分布式爬虫
第6章 抓包的使用与分析=
第7章 Websocket通信网站爬取
第8章 验证码破解
第9章 多线程与多进程并发爬取
第10章 爬虫接口优化
第11章 使用Docker部署爬虫
第二篇 实战案例
第12章 实战1:建立代理IP池
第13章 实战2:磁力链接搜索器
第14章 实战3:爬虫管家
第15章 实战4:数据可视化
第16章 实战5:爬取贴吧中的邮箱
第17章 实战6:批量爬取企业信息
第18章 实战7:爬取公众号历史文章
第19章 实战8:高效爬取——异步爬虫
第20章 实战9:爬取漫画网站
第21章 实战10:给kindle推送爬取的小说
第22章 实战11:爬取游民星空壁纸
第23章 综合实战:建立一个小网站
有粉丝想更多了解此书,请点击下面链接:
送书规则
公众号回复:送书 ,参与抽奖(共5本)
本次送书5本
或者扫一扫下方的二维码回复:送书 即可!