![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
zone7_
这个作者很懒,什么都没留下…
展开
-
使用 python 识别简单验证码
概述简介坑!安装 Tesseract-OCR使用 pytesseract 识别验证码高级玩法 - 除线简介首先呢,简单的验证码是这样的:不是这样的:这里使用了 pytesseract 来进行验证码识别,它是基于 Google 的 Tesseract-OCR ,所以在使用之前需要先安装 Tesseract-OCR。使用 PIL 来进行图像处理。pytess...原创 2018-08-17 18:07:33 · 3124 阅读 · 3 评论 -
scrapy 爬虫初体验(1)
爬虫利器初体验(1)听说你的爬虫又被封了?(2)爬取数据不保存,就是耍流氓(3)爬取两万多租房数据,告诉你广州房租现状(4)scrapy 也能爬取妹子图?(5)目录前言scrapy 数据流scrapy 组件爬取豆瓣电影 Top250后记送书后话前言为什么要学 scrapy 呢?看下图,就清楚了。很多招聘要求都有 scrapy,主要是因为 scrapy 确实很强。那到底...原创 2018-12-25 09:29:34 · 316 阅读 · 0 评论 -
scrapy爬虫进阶解析(2)
爬虫利器初体验(1)听说你的爬虫又被封了?(2)爬取数据不保存,就是耍流氓(3)爬取两万多租房数据,告诉你广州房租现状(4)scrapy 也能爬取妹子图?(5)目录前言SpiderMiddleware瞎比比前言上一篇文章《爬虫利器初体验(1)》中,我们举了个简单的栗子,但是在真实的开发中这样的爬虫代码很容易就会被封掉。那么怎么样才能避免这些事发生呢?这一这篇文章我们一起来...原创 2018-12-25 09:30:21 · 290 阅读 · 0 评论 -
爬取数据不保存,就是耍流氓(3)
爬虫利器初体验(1)听说你的爬虫又被封了?(2)爬取数据不保存,就是耍流氓(3)爬取两万多租房数据,告诉你广州房租现状(4)scrapy 也能爬取妹子图?(5)目录前言ItemsPipelines瞎比比前言OK,通过签名两篇文章《爬虫利器初体验(1)》《听说你的爬虫又被封了?(2)》,我们初体验也过了,爬虫代码健壮性也升级为 PLUS 了。都分析到这个地步了,是不是感觉还...原创 2018-12-25 09:31:18 · 324 阅读 · 0 评论 -
爬取两万多数据,告诉你广州房租价格现状(4)
爬虫利器初体验(1)听说你的爬虫又被封了?(2)爬取数据不保存,就是耍流氓(3)爬取两万多租房数据,告诉你广州房租现状(4)scrapy 也能爬取妹子图?(5)概述前言统计结果爬虫代码实现爬虫分析实现后记前言八月份的时候,由于脑洞大开,决定用 python 爬虫爬取了深圳的租房数据,并写了文章《用Python告诉你深圳房租有多高》,文章得到了一致好评和众多转载。由于我本...原创 2018-12-25 09:31:41 · 1002 阅读 · 0 评论 -
scrapy遇上ajax,抓取QQ音乐周杰伦专辑与歌词(6)
目录序言分析网页分析请求代码实现瞎比比序言好久没写原创文章,早就手痒痒了,所以挤出时间写了这篇,这是下面这五篇文章的连载文章:(1)(2)那这段时间我都去干嘛了呢?时间都用在写小程序(编程面试题库)了,现在也已经写得七七八八了,别看这小程序功能不多。但要做的内容倒是挺多的,给它配了个面试题库的爬虫系统,后台内容管理系统。其中用到了很多技术栈,python、nodejs、fl...原创 2019-02-14 23:40:15 · 647 阅读 · 0 评论 -
反爬虫系列-JS参数篇(1)
目录瞎比比举个栗子?开始分析寒假作业又瞎比比瞎比比之前写了《》这篇文章,其中有些参数,如果不查看其 JS 代码,是无法知道它是怎么来的。说到这里,我们来看看啥是反爬虫?某度如是说:他们根据ip访问频率,浏览网页速度,账户登录,输入验证码,flash封装,ajax混淆,js加密,图片,css混淆等五花八门的技术,来对反网络爬虫。这篇文章还不涉及加密,只是查看一些参数的所以然...原创 2019-02-14 23:41:16 · 394 阅读 · 0 评论 -
2019 Python 高频面试 100 问
####以下内容出自小程序「编程面试题库」0 遇到过得反爬虫策略以及解决方法?1.通过headers反爬虫2.基于用户行为的发爬虫:(同一IP短时间内访问的频率)3.动态网页反爬虫(通过ajax请求数据,或者通过JavaScript生成)4.对部分数据进行加密处理的(数据是乱码)解决方法:对于基本网页的抓取可以自定义headers,添加headers的数据使用多个代理ip进行抓取...原创 2019-06-07 22:02:52 · 5577 阅读 · 0 评论 -
Python 必备 debug 神器:pdb
我的小程序【编程面试题库】目录叨逼叨使用介绍举个简单的栗子叨逼叨首先,介绍一下 pdb 调试,pdb 是 python 的一个内置模块,用于命令行来调试 Python 代码。或许你会说,现在用 Pycharm 等编辑器来调试代码很方便,为啥要用命令行呢?这个问题,我曾经也这么想,直到有一次,代码必须要在 Linux 系统上跑(现在 Pycharm 也可以远程调试代码了,我们先不说...原创 2019-06-07 22:05:43 · 4299 阅读 · 0 评论 -
Python线上环境如何优雅地使用日志?
我的小程序【编程面试题库】本文首发于公众号「zone7」,关注获取最新推文!目录瞎比比与 print 相比 logging 有什么优势?基础用法保存到文件多模块使用 logging使用配置文件配置 logging瞎比比这篇文章其实早在一个月之前就写好了。奈何,加班猛如虎,真的怕了。直至今天才幸运地有了个双休,赶紧排版一下文章发布了。以下为正文。在初学 Python 的...原创 2019-07-28 01:05:48 · 299 阅读 · 0 评论 -
Python 数据库骚操作 -- MySQL
送书福利,送十本 Python 类书籍目录前言MySQL GUI 工具MySQL 遇上 Docker增删改查一对多一对一多对多后记前言今天这篇是三大数据库的结尾篇,前面两篇分别是:《Python 数据库骚操作 – MongoDB》《Python 数据库骚操作 – Redis》,这篇主要介绍 MySQL 的 orm 库 SQLAlchemy 。那什么是 orm 呢?Obje...原创 2018-12-25 09:26:16 · 283 阅读 · 0 评论 -
Python 数据库骚操作 -- Redis
送书福利,送十本 Python 类书籍目录前言Redis GUI 工具Redis 遇上 DockerRedis stringRedis hashRedis listRedis setRedis zset后记前言前面一篇文章介绍了 MongoDB 的库,我把 MySQL 放在了最后面,这篇文章继续介绍 Redis 的操作。Redis支持五种数据类型:string(字符串)...原创 2018-12-25 09:25:09 · 244 阅读 · 0 评论 -
Python 数据库骚操作 -- MongoDB
前言MongoDB GUI 工具PyMongo(同步)Motor(异步)后记前言最近这几天准备介绍一下 Python 与三大数据库的使用,这是第一篇,首先来介绍 MongoDB 吧,,走起!!MongoDB GUI 工具首先介绍一款 MongoDB 的 GUI 工具 Robo 3T,初学 MongoDB 用这个来查看数据真的很爽。可以即时看到数据的增删改查,不用操作命令行来查看...原创 2018-12-25 09:24:35 · 197 阅读 · 0 评论 -
用Python告诉你深圳房租有多高
概述前言统计结果爬虫技术分析爬虫代码实现爬虫分析实现后记前言最近各大一二线城市的房租都有上涨,究竟整体上涨到什么程度呢?我们也不得而知,于是乎 zone 为了一探究竟,便用 Python 爬取了房某下的深圳的租房数据,以下是本次的样本数据: 除去【不限】的数据(因为可能会与后面重叠),总数据量为 16971 ,其中后半部分地区数据量偏少,是由于该区房源确实不足。...原创 2018-08-29 08:25:59 · 925 阅读 · 0 评论 -
秋招季,用Python分析深圳程序员工资有多高?
概述前言统计结果爬虫技术分析爬虫代码实现爬虫分析实现后记预告前言多图预警、多图预警、多图预警。秋招季,毕业也多,跳槽也多。我们的职业发展还是要顺应市场需求,那么各门编程语言在深圳的需求怎么呢?工资待遇怎么样呢?zone 在上次写了这篇文章之后【[用Python告诉你深圳房租有多高](https://mp.weixin.qq.com/s/qnTzMpQPfWrfyNB...原创 2018-09-04 09:38:20 · 978 阅读 · 0 评论 -
小白入门微服务(0) - 什么是微服务
概述前言什么是微服务微服务的特征与优势微服务的不足微服务如何通信我该使用使用微服务吗?前言大半年前,我第一次听说【微服务】这个词,当时由于好奇心,就 Google 了一下这个词,从此埋下了一颗学习微服务的心。在前半年的时间里因为忙,所以抽不出完整的时间块来学习微服务。但都有使用闲碎的时间来看相关的概念与架构。最近总算是有点时间了,我觉得光看概念是没有用的,要真真实实地...原创 2018-09-08 12:43:03 · 1553 阅读 · 4 评论 -
小白入门微服务(2) - 消息队列初体验
概述前言消息队列使用场景什么是消息队列常用消息队列库对比Kafka 初体验RabbitMQ 初体验后记前言前面两篇我们学习了 - 小白入门微服务(0) - 什么是微服务 - 小白入门微服务(1) - RPC 初体验接下来我们来学习微服务中的异步通信 - 消息队列。在这篇文章的学习中,默认你已经掌握了 Docker、docker-compose 的知识。如果你...原创 2018-09-13 09:38:59 · 1615 阅读 · 0 评论 -
Python 数据库骚操作 -- MongoDB
本文首发于公众号「zone7」,关注获取最新推文!前言MongoDB GUI 工具PyMongo(同步)Motor(异步)后记前言最近这几天准备介绍一下 Python 与三大数据库的使用,这是第一篇,首先来介绍 MongoDB 吧,,走起!!MongoDB GUI 工具首先介绍一款 MongoDB 的 GUI 工具 Robo 3T,初学 MongoDB 用这个来查看数据真的...原创 2018-11-07 16:25:50 · 332 阅读 · 0 评论 -
python 数据可视化利器 plus
本文首发于公众号「zone7」,关注获取最新推文!概述前言推荐plotlybokehpyecharts后记前言更新:上一篇文章《python 数据可视化利器》中,我写了 bokeh、pyecharts 的用法,但是有一个挺强大的库 plotly 没写,主要是我看到它的教程都是在 jupyter notebooks 中使用,说来也奇怪,硬是找不到如何本地使用(就是本地输出 h...原创 2018-11-07 16:28:19 · 434 阅读 · 0 评论 -
python 实现二叉树的深度&&广度优先遍历
本文首发于公众号「zone7」,关注获取最新推文!概述前言什么是树什么是二叉树深度优先广度优先后记前言前面说到算法被虐了,这回我要好好把它啃下来。哪里跌倒就要从哪里站起来。这是我复习算法与数据结构时的小笔记,这里就 po 出来,给大家也复习一下旧的知识点,查缺补漏。如果我的文章对你有帮助,欢迎关注、点赞、转发,这样我会更有动力做原创分享。什么是树在计算器科学中,树(英...原创 2018-11-07 16:32:07 · 612 阅读 · 1 评论 -
LeetCode 102 && 429 广度优先遍历
本文首发于公众号「zone7」,关注获取最新推文!概述前言429 N 叉树的层次遍历 90.36%102 二叉树的层次遍历 99.76%后记前言不管经济多不好,提高自身硬实力才是关键。最近我也开始刷题了,所以后面的文章会时不时出现 LeetCode 的题。希望我们一起提高,一起进步。429 N 叉树的层次遍历 90.36%给定一个 N 叉树,返回其节点值的层序遍历。 (即从...原创 2018-11-07 16:33:53 · 478 阅读 · 0 评论 -
LeetCode 深度优先遍历
本文首发于公众号「zone7」,关注获取最新推文!概述前言104 二叉树的最大深度【简单】111 二叉树的最小深度 【简单】124 二叉树中的最大路径和 【困难】后记前言我前面的文章《python 实现二叉树的深度&&广度优先遍历》介绍了二叉树的相关知识。《LeetCode 102 && 429 广度优先遍历)》这篇做了一些关于广度优先遍历...原创 2018-11-07 16:35:28 · 892 阅读 · 0 评论 -
python面试专题--with 关键字与上下文管理
本文首发于公众号「zone7」,关注获取最新推文!瞎比比聊聊为什么要用 with、contextlib举个栗子with、contextlib 原理常见的 with 用例瞎比比本文源码地址:https://github.com/zonezoen/blog/tree/master/python/interview最近秋招就要到了,我准备了 Python 面试的一系列专题,涉及到...原创 2019-08-11 17:52:16 · 250 阅读 · 0 评论