自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 资源 (3)
  • 收藏
  • 关注

原创 程序员到底该怎么给女朋友挑礼物

“ 阅读本文大概需要 12 分钟。 ”大家好,我是编辑部小马。马上就要双十一了,我知道,你们着急,我也着急。你们可能挺着急的,马上双十一了,买点什么送给我心爱的小芳呢。我也挺着急的,马上双十一了,怎么让崔庆才知道该买什么送给他亲爱的我呢。我曾经收到过,一打开就会日日日的不停震动的电热暖宝宝,每当我天冷的时候带上它,肝肠脾胃都会随着开机的声音开始疯狂地颤动。我曾经在菜鸟裹裹这个软件,收到过信息提示,...

2019-10-31 18:00:00 802

转载 Google 资深软件工程师 LeetCode 刷题笔记首次公开

“ 阅读本文大概需要 6分钟。 ”有人说写代码就像我们平时开车,仅凭经验你就可以将车开走;但当有一天,这辆车出问题跑不起来的时候,你不懂汽车的运行机制,你要怎么排除和解...

2019-10-30 08:30:00 175

转载 爬信息爬到服务器瘫痪,今日头条的头条搜索成了小网站的噩梦!

“ 阅读本文大概需要 7 分钟。 ”今年上半年,字节跳动放出了个让百度虎躯一震的消息 ——今日头条开始做搜索引擎了。两个月前还大张旗鼓的在亲爸爸字节跳动的官方公众号上招...

2019-10-29 18:00:00 1091

转载 想转数据分析或机器学习,这本书是必须要会的!

大家好我是崔庆才,我又来了。平时会有很多人问我,如果学习了爬虫,下面一步可以往什么方向发展呢?我个人建议是可以往数据分析或机器学习的方向扩展和学习,我个人是选择了后者,平...

2019-10-28 11:40:00 165

转载 爬虫究竟是合法还是违法的?

之前朋友圈和各大公号传播了一篇文章,讲述程序员因写爬虫而被刑侦的事件。很多爬虫工程师看了之后感觉人心惶惶的,当时大家讨论最热是:爬虫究竟是合法还是违法的?这篇文章我个人觉...

2019-10-27 18:21:52 3826

转载 产品经理相亲图鉴

产品经理在大家眼中,应该是一个特别会Social的角色,毕竟,开发、设计、运营、老板,没有他吵不赢搞不定的人。而且,产品经理情商高,能力强,逻辑好,有情趣,但为什么一群这...

2019-10-26 11:44:28 90 1

原创 分享崔庆才的一些学习经验和生活感悟

大家好,我是运营小马。正如我们所知道的那样,10.23日 ,崔庆才因为写文写得很痛苦,将公众号转给我运营。10.24 我兴致勃勃又小心翼翼的宣布了我要运营10.25 崔庆...

2019-10-25 23:30:09 725

转载 程序员都是单身狗?我有一句 XXX,不知当讲不当讲

“ 阅读本文大概需要 3 分钟。 ”每一只程序员,上辈子都是天煞孤星单身,仿佛就是他们的专属名词每每提起他们的职业总让人不自主地脑补出孤苦伶仃通宵 Coding 的场景...

2019-10-24 17:00:00 1130

原创 新运营者小马的接任发言(内含福利

大家好,今天是10.24号,是我运营这个公众号的第一天。就在前天,10.22 号,我收到了崔庆才的一条信息我随口答应。行啊有啥不行啊!有啥焦虑的有啥的!爸爸帮你!嗨呀客气...

2019-10-24 17:00:00 183

原创 直播分享我的一些职场和行业经验

“ 阅读本文大概需要 3 分钟。 ”关注我的朋友可能大多数都接触过网络爬虫,最近大家也可以看到很多新闻曝出来许多与信贷、风控相关的公司都关停了,很多媒体也就把一些责任归咎...

2019-10-23 08:31:00 792

原创 我将退居本公众号幕后一段时间

“ 阅读本文大概需要 2 分钟。 ”正式参加工作以后,发现时间真的是越来越不够用了。而我想做的事情却越来越多。认识或了解我的朋友可能看到我平时过得还挺好的,但是其实真实内...

2019-10-23 08:31:00 303

原创 史上规模最大的中文知识图谱以及估值两个亿的 AI 核心代码

“ 阅读本文大概需要 5 分钟。 ”—— 大声告诉我,怎样才能可以让你变得更强?—— 充钱—— ???—— 都什么玩意?还有啥子咧?—— 充更多钱执迷不悟,无可救药了。所...

2019-10-21 08:36:00 536

转载 给大家推荐一位我佩服的 Python 工程师

“ 阅读本文大概需要 2 分钟。 ”今天给大家介绍一位 Python Web 开发大牛,「涛哥聊Python」的公众号主理人彭涛,Python 全栈工程师,技术负责人,项...

2019-10-20 12:51:54 289

转载 免费送你阿里云大佬的爬虫与数据分析资料

“ 阅读本文大概需要 2 分钟。 ”2019 年的大环境是这样的:秋招数据分析岗竞争异常激烈,大厂对于数据分析岗位人才的争夺无异于神仙打架争相抢夺,薪资普遍 30k-50...

2019-10-18 11:31:00 352

原创 如何用 Python 给照片换色

“ 阅读本文大概需要 6 分钟。 ”最近遇到了一个需求,就是对图片进行色彩风格转换,让一个物体可以以各种不同的色彩来呈现。比如一个红色的苹果,我想把它转化成绿色,这可怎么...

2019-10-17 23:50:30 5534 9

转载 嗯,我们出了一套做爬虫必备的 JS 逆向课程

“ 阅读本文大概需要 4 分钟。 ”爬虫是大数据时代不可或缺的数据获取手段,它是综合技术的应用体现。有取就有失,有攻就有防。开发者为了保护数据,不得已想出了很多办法来限制...

2019-10-16 18:35:35 4682 3

转载 只因写了一段爬虫,公司 200 多人被抓!

“ 阅读本文大概需要 4 分钟。 ”“一个程序员写了个爬虫程序,整个公司 200 多人被端了。”“不可能吧!”刚从朋友听到这个消息的时候,我有点不太相信,做为一名程序员来...

2019-10-16 18:35:35 1434

原创 Python 中更优雅的日志记录方案

“ 阅读本文大概需要 5 分钟。 ”在 Python 中,一般情况下我们可能直接用自带的 logging 模块来记录日志,包括我之前的时候也是一样。在使用时我们需要配置一...

2019-10-13 23:57:23 1099 3

转载 为什么他也是做爬虫的,公众号 3 年就做到了 48W 粉?

“ 阅读本文大概需要 3 分钟。 ”今天给大家推荐一位自学转行 Python 数据挖掘算法的朋友:王大伟。他是公众号“Python爱好者社区”公众号的唯一小编,目前他的...

2019-10-12 08:21:00 270

转载 不仅仅可以用来做爬虫,Puppeteer 还可以干这个!

Python 自动化测试工具大家可能知道 Pyppeteer,其实它就是 Puppeteer 的 Python 版本的实现,二者功能类似。但其实 Puppeteer 和 ...

2019-10-10 21:10:12 1339

原创 如何用一条命令将网页转成电脑 App

“ 阅读本文大概需要 3 分钟。 ”大家有没有一种感觉,很多网站其实做得非常优秀,但是它们就是没有开发 PC (电脑)版的客户端,比如知乎、GitHub、微信公众号。如果...

2019-10-09 22:39:52 3190

转载 相亲贴,单身小姐姐你在哪里,我是书豪,我在等你!

“ 阅读本文大概需要 5 分钟。 ”这篇文章是为我的一位朋友「书豪」转的。他是一名程序员,现在 24 岁,工作在上海,从事数据分析相关的工作,已经出版了一本书《R数据科学...

2019-10-03 22:09:35 418

转载 美国 AI 顶级院校博士机器学习课程是什么样的?

训练营采用美国顶级院校的教学体系,帮助你在4-6 个月内找到一份人工智能、机器学习、深度学习、数据科学家、算法工程师等AI相关岗位,或协助你申请美国、欧洲相关院校 AI...

2019-10-02 12:00:00 579

《Python3网络爬虫开发实战》崔庆才 PDF 正版 高清

《Python3网络爬虫开发实战》崔庆才著 PDF 正版 高清。 本书介绍了如何利用Python 3开发网络爬虫,书中首先介绍了环境配置和基础知识,然后讨论了urllib、requests、正则表达式、Beautiful Soup、XPath、pyquery、数据存储、Ajax数据爬取等内容,接着通过多个案例介绍了不同场景下如何实现数据爬取,最后介绍了pyspider框架、Scrapy框架和分布式爬虫。 1-开发环境配置 1.1-Python3的安装 1.2-请求库的安装 1.3-解析库的安装 1.4-数据库的安装 1.5-存储库的安装 1.6-Web库的安装 1.7-App爬取相关库的安装 1.8-爬虫框架的安装 1.9-部署相关库的安装 2-爬虫基础 2.1-HTTP基本原理 2.2-网页基础 2.3-爬虫的基本原理 2.4-会话和Cookies 2.5-代理的基本原理 3-基本库的使用 3.1-使用urllib 3.1.1-发送请求 3.1.2-处理异常 3.1.3-解析链接 3.1.4-分析Robots协议 3.2-使用requests 3.2.1-基本用法 3.2.2-高级用法 3.3-正则表达式 3.4-抓取猫眼电影排行 4-解析库的使用 4.1-使用XPath 4.2-使用Beautiful Soup 4.3-使用pyquery 5-数据存储 5.1-文件存储 5.1.1-TXT文本存储 5.1.2-JSON文件存储 5.1.3-CSV文件存储 5.2-关系型数据库存储 5.2.1-MySQL存储 5.3-非关系型数据库存储 5.3.1-MongoDB存储 5.3.2-Redis存储 6-Ajax数据爬取 6.1-什么是Ajax 6.2-Ajax分析方法 6.3-Ajax结果提取 6.4-分析Ajax爬取今日头条街拍美图 7-动态渲染页面爬取 7.1-Selenium的使用 7.2-Splash的使用 7.3-Splash负载均衡配置 7.4-使用Selenium爬取淘宝商品 8-验证码的识别 8.1-图形验证码的识别 8.2-极验滑动验证码的识别 8.3-点触验证码的识别 8.4-微博宫格验证码的识别 9-代理的使用 9.1-代理的设置 9.2-代理池的维护 9.3-付费代理的使用 9.4-ADSL拨号代理 9.5-使用代理爬取微信公众号文章 10-模拟登录 10.1-模拟登录并爬取GitHub 10.2-Cookies池的搭建 11-App的爬取 11.1-Charles的使用 11.2-mitmproxy的使用 11.3-mitmdump爬取“得到”App电子书信息 11.4-Appium的基本使用 11.5-Appium爬取微信朋友圈 11.6-Appium+mitmdump爬取京东商品 12-pyspider框架的使用 12.1-pyspider框架介绍 12.2-pyspider的基本使用 12.3-pyspider用法详解 13-Scrapy框架的使用 13.1-Scrapy框架介绍 13.2-Scrapy入门 13.3-Selector的用法 13.4-Spider的用法 13.5-Downloader Middleware的用法 13.6-Spider Middleware的用法 13.7-Item Pipeline的用法 13.8-Scrapy对接Selenium 13.9-Scrapy对接Splash 13.10-Scrapy通用爬虫 13.11-Scrapyrt的使用 13.12-Scrapy对接Docker 13.13-Scrapy爬取新浪微博 14-分布式爬虫 14.1-分布式爬虫原理 14.2-Scrapy-Redis源码解析 14.3-Scrapy分布式实现 14.4-Bloom Filter的对接 15-分布式爬虫的部署 15.1-Scrapyd分布式部署 15.2-Scrapyd-Client的使用 15.3-Scrapyd对接Docker 15.4-Scrapyd批量部署 15.5-Gerapy分布式管理

2018-06-26

Java核心技术(卷一)

本书为java核心技术 卷一 基础知识 扫描版文件,清晰度还可以,敬请下载

2013-11-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除