送书 | 《Python3爬虫实战——数据清洗、数据分析与可视化》

最新推荐文章于 2023-05-29 16:18:51 发布

敲代码的灰太狼

最新推荐文章于 2023-05-29 16:18:51 发布

阅读量2.8k

点赞数 1

文章标签： python 编程语言大数据数据分析数据挖掘

又到了每周三的送书时刻啦！今天给大家带来的是《Python3爬虫实战——数据清洗、数据分析与可视化》

（文末查看送书规则）

内容简介

作为一个自学爬虫的过来人，曾经走过很多弯路，在自学的道路上也迷茫过。每次面对一个全新的网站，都像是踏进一个未知的世界。你不知道前面有哪些反爬手段在等着你；你不知道你会踩进哪个坑里。我做爬虫的几年时间里，爬过很多的网站、遇到过很多的难题。这本书就是我这几年经验的总结，从开始的工具的学习使用，到实战项目的爬取，难度一步一步的升级，需求也越来越复杂，有各式各样的爬取方式。

本书主要内容与数据爬取相关，包括编写爬虫所需要的基础编程知识，如Requests包、Scrapy框架和数据库的使用，到项目实战教程，适合Python基础入门的读者。如果你是其他行业的从业者，想进入IT行业成为一位爬虫工程师，又或者你已经是IT行业的从业者，本书在能够让你在对爬虫工程师的工作内容有所了解的同时，也能让你掌握作为一个爬虫工程师所需要具备的基础技能。

作者简介

姚良 2016-2019 深圳丝路天地电子商务有限公司爬虫工程师。熟练使用Python语法，面向对象编程，JS破解、分布式爬虫、Scrapy框架、Requests库、Redis、Mongodb、高并发、异步编程。

本书适合人群

Python初学者，数据分析师，金融证券从业人员，编程爱好者，大数据从业人员，创业公司老板等。

目录

第一篇基础知识

第1章　Python环境搭建

第2章　常用爬虫库Requests

第3章　常用爬虫框架Scrapy

第4章　数据存储——数据库的选择

第5章　效率为王——分布式爬虫

第6章　抓包的使用与分析=

第7章　Websocket通信网站爬取

第8章　验证码破解

第9章　多线程与多进程并发爬取

第10章　爬虫接口优化

第11章　使用Docker部署爬虫

第二篇实战案例

第12章　实战1：建立代理IP池

第13章　实战2：磁力链接搜索器

第14章　实战3：爬虫管家

第15章　实战4：数据可视化

第16章　实战5：爬取贴吧中的邮箱

第17章　实战6：批量爬取企业信息

第18章　实战7：爬取公众号历史文章

第19章　实战8：高效爬取——异步爬虫

第20章　实战9：爬取漫画网站

第21章　实战10：给kindle推送爬取的小说

第22章　实战11：爬取游民星空壁纸

第23章　综合实战：建立一个小网站

有粉丝想更多了解此书，请点击下面链接：

送书规则

公众号回复:送书 ,参与抽奖（共5本）

本次送书5本

或者扫一扫下方的二维码回复：送书 即可！

敲代码的灰太狼

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
送书 | 《Python3爬虫实战——数据清洗、数据分析与可视化》

又到了每周三的送书时刻啦！今天给大家带来的是《Python3爬虫实战——数据清洗、数据分析与可视化》（文末查看送书规则）内容简介作为一个自学爬虫的过来人，曾经走过很多弯路，在...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。