自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (3)
  • 收藏
  • 关注

转载 给大家推荐一本 Python 书

“ 阅读本文大概需要 5 分钟。 ”之前答应了一个推广,安排在今天了。今天给大家推荐一本 Python 的书,叫做《疯狂Python讲义》,想必大家听着可能有点耳熟,我当...

2019-05-30 12:32:30 1235

原创 正式工作后的一些变化和感受

“ 阅读本文大概需要 8 分钟。 ”这篇是昨晚上写的,写着写着过了零点了,就今天发吧。感觉又一段时间没有更新原创文了,今天趁着刚刚下班的时候,写点什么。没错,我现在刚刚下...

2019-05-29 10:26:05 4796

转载 在阿里,一个完整的机器学习项目是这样运作的。

“ 阅读本文大概需要 4 分钟。 ”大家好,我是 Chris,入行前 5 年在一家上市游戏公司做算法,从数据挖掘算法在业务线落地开始,涉及机器学习、深度学习,后来逐步负责...

2019-05-24 09:30:00 2402

转载 使用 Python 分析 14 亿条数据

你用 Python 处理过的最大数据集有多大?我想大概不会超过上亿条吧,今天分享一个用 Python 处理分析 14 亿条数据的案例。转载来源原文博客:https://h...

2019-05-23 22:06:19 880

原创 小奎因的 PYTHON 项目部署与调度直播分享来了

“ 阅读本文大概需要 10 分钟。 ”“凉风有性 秋月无边……” 编不下去了。自从上次发布开源库 aiowebsocket 之后,小奎因已经很久没有在公众号露面了。其是这...

2019-05-22 09:38:00 232

转载 3 步理清 Python 数据分析关键点,新手必看

“ 阅读本文大概需要 5 分钟。 ”大家好,我是大鹏,城市数据团联合发起人,致力于 Python 数据分析、数据可视化的应用与教学。和很多同学接触过程中,我发现自学 Py...

2019-05-21 12:00:00 678

转载 5 张图彻底理解 Python 中的浅拷贝与深拷贝

假设你去面试 Python 开发岗,面试官如果对基础比较看重的话,那么很可能会问你这样的问题“谈谈你对 Python 中的浅拷贝和深拷贝的理解?”若平时你在开发中过度使用...

2019-05-18 21:43:13 183

转载 1 行 Python 代码能干哪些事,这 13 个你知道吗?

Python 之禅有一句话叫 “Simple is better than complex.”,简单,到底能多简单,一行代码?你别说,一行代码还真能干不少事,这次转载一篇...

2019-05-15 21:57:37 446

转载 命名难,难于上青天

写代码一个很棘手的问题是什么?是给变量取名,这可能是伴随着程序猿永久的问题。反正我记得最初写代码的时候我都是用 a、b、c 这样的变量命名的,现在想想真是....不忍直想...

2019-05-14 20:58:55 126

转载 20 个安全可靠的免费数据源,各领域数据任你挑

我们都喜欢免费的东西,对吧?实际上,虽然网络上充斥着各种免费信息,但这些信息有时是错误或具有误导性的。但以下这 20 个是被广泛认为相当可信的免费数据源。转载来源公众号:...

2019-05-13 20:37:10 448

原创 为什么你就不能加个空格呢?

“ 阅读本文大概需要 8 分钟。 ”想写这篇文章很久了,也想做这件事很久了,我个人感觉自己是有强迫症的,所以一直有什么事让我看着不太舒服就想把它纠正过来。文字,也不例外。...

2019-05-07 22:54:56 806

《Python3网络爬虫开发实战》崔庆才 PDF 正版 高清

《Python3网络爬虫开发实战》崔庆才著 PDF 正版 高清。 本书介绍了如何利用Python 3开发网络爬虫,书中首先介绍了环境配置和基础知识,然后讨论了urllib、requests、正则表达式、Beautiful Soup、XPath、pyquery、数据存储、Ajax数据爬取等内容,接着通过多个案例介绍了不同场景下如何实现数据爬取,最后介绍了pyspider框架、Scrapy框架和分布式爬虫。 1-开发环境配置 1.1-Python3的安装 1.2-请求库的安装 1.3-解析库的安装 1.4-数据库的安装 1.5-存储库的安装 1.6-Web库的安装 1.7-App爬取相关库的安装 1.8-爬虫框架的安装 1.9-部署相关库的安装 2-爬虫基础 2.1-HTTP基本原理 2.2-网页基础 2.3-爬虫的基本原理 2.4-会话和Cookies 2.5-代理的基本原理 3-基本库的使用 3.1-使用urllib 3.1.1-发送请求 3.1.2-处理异常 3.1.3-解析链接 3.1.4-分析Robots协议 3.2-使用requests 3.2.1-基本用法 3.2.2-高级用法 3.3-正则表达式 3.4-抓取猫眼电影排行 4-解析库的使用 4.1-使用XPath 4.2-使用Beautiful Soup 4.3-使用pyquery 5-数据存储 5.1-文件存储 5.1.1-TXT文本存储 5.1.2-JSON文件存储 5.1.3-CSV文件存储 5.2-关系型数据库存储 5.2.1-MySQL存储 5.3-非关系型数据库存储 5.3.1-MongoDB存储 5.3.2-Redis存储 6-Ajax数据爬取 6.1-什么是Ajax 6.2-Ajax分析方法 6.3-Ajax结果提取 6.4-分析Ajax爬取今日头条街拍美图 7-动态渲染页面爬取 7.1-Selenium的使用 7.2-Splash的使用 7.3-Splash负载均衡配置 7.4-使用Selenium爬取淘宝商品 8-验证码的识别 8.1-图形验证码的识别 8.2-极验滑动验证码的识别 8.3-点触验证码的识别 8.4-微博宫格验证码的识别 9-代理的使用 9.1-代理的设置 9.2-代理池的维护 9.3-付费代理的使用 9.4-ADSL拨号代理 9.5-使用代理爬取微信公众号文章 10-模拟登录 10.1-模拟登录并爬取GitHub 10.2-Cookies池的搭建 11-App的爬取 11.1-Charles的使用 11.2-mitmproxy的使用 11.3-mitmdump爬取“得到”App电子书信息 11.4-Appium的基本使用 11.5-Appium爬取微信朋友圈 11.6-Appium+mitmdump爬取京东商品 12-pyspider框架的使用 12.1-pyspider框架介绍 12.2-pyspider的基本使用 12.3-pyspider用法详解 13-Scrapy框架的使用 13.1-Scrapy框架介绍 13.2-Scrapy入门 13.3-Selector的用法 13.4-Spider的用法 13.5-Downloader Middleware的用法 13.6-Spider Middleware的用法 13.7-Item Pipeline的用法 13.8-Scrapy对接Selenium 13.9-Scrapy对接Splash 13.10-Scrapy通用爬虫 13.11-Scrapyrt的使用 13.12-Scrapy对接Docker 13.13-Scrapy爬取新浪微博 14-分布式爬虫 14.1-分布式爬虫原理 14.2-Scrapy-Redis源码解析 14.3-Scrapy分布式实现 14.4-Bloom Filter的对接 15-分布式爬虫的部署 15.1-Scrapyd分布式部署 15.2-Scrapyd-Client的使用 15.3-Scrapyd对接Docker 15.4-Scrapyd批量部署 15.5-Gerapy分布式管理

2018-06-26

Java核心技术(卷一)

本书为java核心技术 卷一 基础知识 扫描版文件,清晰度还可以,敬请下载

2013-11-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除