
python
Leon0204
这个作者很懒,什么都没留下…
-
原创 爬虫问题汇总
request / BeautifulSoup 解析 ISO - 8859 - 1 / GB2312 页面乱码错误设置 r.encoding = ‘GB2312’# r.encoding = 'GB2312'r = requests.get(i,) print(r.encoding) # ISO - 8859 - 1 r.encoding = 'GB2312'print (r.text) :# 国物权法》(上册),张双根译,法律出版社</span><s2020-09-11 10:42:0647
0
-
原创 Keras TensorFlow 验证码识别(附数据集)
效果先看效果图,左边是 两张测试数据,右边是 预测结果标注数据集下载地址已更新实现1. 训练模型bathcsize 为 700 轮次 50#!/usr/bin/env python# coding: utf-8# # 训练模型# # ## 引入第三方包# In[1]:from PIL import Imagefrom keras import backend as Kfrom keras.utils.vis_utils import plot_modelfrom ke2020-08-14 09:16:36627
0
-
原创 tornado 消费队列并配合 superviosr 优雅重启
当你用tornado 作为一个消费队列的实例,如果tornado 异常了,如何在消费队列中重启tornado实例,并继续下一个消费?2020-06-20 10:07:58126
0
-
原创 pika python rabbitmq 优先级队列、查看队列剩余数目
话不多说,直接上代码。python3.6 pika 实现rabbitmq 优先级队列Sendimport pikaimport sysimport time# 远程rabbitmq服务的配置信息username = '用户名' # 指定远程rabbitmq的用户名密码pwd = '密码'ip_addr = 'ip'port_num = 5672# 消息队列服务的连接和队列的创建credentials = pika.PlainCredentials(username, p2020-05-21 16:17:22458
0
-
原创 解析redis bitmap数据
import redisimport binascii#连接redispool = redis.ConnectionPool(host='122.112.163.26', port=6379, db=0, password='fb0401')r = redis.Redis(connection_pool=pool)#获取bitmap 存储 的字符 ==> b'` \x00\x0...2020-04-25 17:12:15157
0
-
原创 Python3 列表解析和迭代器的内存占用过程分析
列表解析表达式先来看一个例子~ Leetcode 171 题解法很简单: sum = 0 for i in range(0, len(s): sum += 26 ** (len(s) - 1 - i) * (ord(s[i]) - ord("A") + 1) return sum那么,这里也可以这么写。 return sum...2019-12-05 16:22:12645
0
-
原创 56. 合并区间 python3
给出一个区间的集合,请合并所有重叠的区间。示例 1:输入: [[1,3],[2,6],[8,10],[15,18]]输出: [[1,6],[8,10],[15,18]]解释: 区间 [1,3] 和 [2,6] 重叠, 将它们合并为 [1,6].示例 2:输入: [[1,4],[4,5]]输出: [[1,5]]解释: 区间 [1,4] 和 [4,5] 可被视为重叠区间。c...2019-12-03 14:14:52151
0
-
原创 文件名路径有/ 导致目录不存在的问题 No such file or directory
在目录中存在/ 时,读取或写入就会报错 FileNotFoundError: [Errno 2] No such file or directory解决办法如下:title = "ELK CI/CD 部署实践2017-11-06 by leon.pdf"#替换以下的 半角符号 --> 全角符号title = title.replace('/', '/') \ .repl...2019-11-29 15:12:541346
0
-
原创 Python3 设置 profile 环境变量
服务器环境 centos7.3 ,由于服务器上profile设置了代理代理仅限访问 A 网站,这时,我需要在我的 Python 脚本中访问 B 网站 ,就会因为代理的原因 无法访问B网站。总不能每次都运行脚本前去 修改 profile 文件 删除代理吧?在python中删除代理 / 修改环境变量OS模块 system (Failed)发现依然是拒绝访问,说明不能通过这种方式(...2019-11-21 10:12:26824
0
-
原创 一篇最全整理,教会你离线部署Python3和pip包
本文介绍离线安装(无网模式)的坑点1 重新安装 openssl先把系统自带的这些,卸载/删除#编译安装opensslhttp://www.openssl.org/source/ cd /openssl-1.1.1sudo ./config shared --prefix=/usr/local/openssl --openssldir=/usr/lib/opensslmake &...2019-11-10 10:08:14570
0
-
原创 Python 设置 IP 代理 访问网页 ( 用户名密码验证代理 )
需求如下:待爬取的页面想爬取的部分查看源码,在Js中有返回正常访问时候,使用Firefox代理插件 FoxyProxy 设置代理才能访问到的。本来想用 Selinum打开 FireFox,不过卡在了插件,和插件自动 填充账号密码这块儿,后来发现直接用 urlib 做网络请求 ,然后bs4 解析更方便, 代码如下:import urllib.request as rproxy...2019-10-24 09:26:221669
0
-
原创 PySpark DataFrame 操作
SQl 获取 DF 操作# coding:utf-8from pyspark.sql import SparkSessionfrom pyspark.sql.utils import AnalysisExceptionif __name__ == '__main__': spark = SparkSession.builder.enableHiveSupport().appNa...2019-09-25 10:14:03254
0
-
原创 PySpark Rdd操作
from pyspark import SparkContext, SparkConfconf = SparkConf().setAppName("rdd_trans")sc = SparkContext(conf=conf)print(sc.version)# 创建rdd = sc.parallelize([2, 3, 4, 5, 6, 6, 6, 6, 6])rdd1 = r...2019-09-23 15:22:39199
0
-
原创 Python中的GIL和异步Asyncio、Futures
一 、基本概念以下概念都是在 Python 环境下Sync 同步编程Async 异步 ,是指在外观上看来程序不会等待,而是找出可执行的操作/任务/线程 继续执行Asyncio 单个主线程 多个不同的任务 task ,这些 future 对象 被 event loop 对象控制,就好像多线程版本的多个线程GIL 全局解释器锁 Global Interpret LockTask ...2019-08-14 11:05:14454
0
-
原创 Python 中的 迭代器 和 生成器
生成器验证数学表达式"""验证 (1 + 2 + 3 + 4 + 5 + ...) ^ 2 = 1^3 + 2^3 + 3^3 + 4^3 + 5^3 + ...# 分别用生成器 生成 左边 1次方 和右边 3次方 的sum"""def generator(k): i = 1 while True: yield i ** k i ...2019-08-02 08:58:3783
0
-
原创 抓取微信公众号文章,亲测有效
CatchWecaht抓取微信公众号文章pre: 没有用框架,直接clone 就可以用。获取代码 cd /home/wwwroot git clone https://github.com/leon0204/catchWecaht.git导入模板数据库,先创建weixin 数据库 utf8mb4 cd catchWecaht mysql -uroot -p we2017-07-04 10:29:553501
2
-
转载 centos6默认python2.6升级2.7 卸载python2.6升级2.7
本文介绍CentOS 6.3从自带的Pyhon版本是2.6升级到2.7.6的方法。因为CentOS系统中旧版本的Python已被深度依赖,所以不能卸载原有的python,只能全新安装。1.下载Pyhon,选择下载Gzipped source tar ball (2.7.6) (sig) 网址https://www.python.org/download/releases/2.7.6 wget2017-07-10 11:57:06983
0
-
原创 Django解决跨域访问报错/Cros问题
两种方法:拼数据def myview(_request): response = HttpResponse(json.dumps({"key": "value", "key2": "value"})) response["Access-Control-Allow-Origin"] = "*" response["Access-Control-Allow-Methods"] = "PO2017-08-17 15:30:512948
0
-
原创 TypeError: unbound method x must be called with x instance as first argument (got nothing instead)
TypeError: unbound method x must be called with x instance as first argument (got nothing instead) --没有对类进行实例化就调用他的方法错误示例假设在 commandModel 中有 Model 类, 有一个 test 方法 ,我们这样调用:from commandModel import Mo2017-08-21 14:06:274134
0
-
原创 MySQLdb ImportError: libmysqlclient.so.18
找不着一个交libmysqlclient.so.18的文件,于是到mysql安装目录里找到这个文件并且做一个软连接到/usr/lib,如果是64则把lib 换成lib64 ln -s /usr/local/mysql/lib/libmysqlclient.so.18 /usr/lib/libmysqlclient.so.18查看系统是32 还是64?uname -aLinux macco-db-m2017-08-24 19:29:531528
0
-
原创 字符编码和gcc问题
1 unicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe9 in position 29: ordinal not in range(128)1的解决办法 :在文件头部添加import sysreload(sys)sys.setdefaultencoding('utf8')这种错误多出现在 Python2 中,用于修改 ascii 为2017-09-19 10:38:36554
0
-
原创 利用python 更新ssh 远程代码 操作远程服务器
用python paramiko ssh 服务器,并pull对应目录代码的脚本pull.pyimport paramikoimport sysdef sshclient_execmd(hostname, port, username, password, execmd): paramiko.util.log_to_file("paramiko.log") s = paramiko.2017-09-19 10:30:251408
0
-
原创 Python GUI 编程,看完这一篇你就会了
easyguiPython 的 GUI 编程,这里用的是 easygui ,完成一些简单的图形化界面开发。基本组件:__all__ = ['buttonbox', 'diropenbox', 'fileopenbox', 'filesavebox', 'textbox', 'ynbo...2019-05-21 09:59:039223
4
-
原创 简单看看 Python 中的 List 和 Tuple
1. 为什么 list 比 tuple 要多16个字节?l = [1, 2, 3]t = (1, 2, 3)print(l.__sizeof__())# 64# 列表是动态的,存储指针,指向对应的元素, int 8字节# 动态存储 List 还存储了 已分配长度大小 8字节print(t.__sizeof__())# 482. List 的 over-allocatingl ...2019-07-09 15:50:24138
0
-
原创 稍微不那么简单,看看Python 中的 List 和 Tuple
简单看看 Python 中的 List 和 TupleListl = []print(l,l.__sizeof__())# l 初始化40字节l.append(1)# 增加一个元素后,(注意,这里是append之后,)预分配了 4个 元素的32 个字节print(l,l.__sizeof__())# 72l += ([2, 3, 4])print(l,l.__sizeof__(...2019-07-22 14:45:0697
0
-
原创 python 模拟登陆百度
0 20 * * * /home/wwwroot/kgopen/commands/autoPush/interval.sh >> /home/wwwroot/kgopen/commands/autoPush/push.log 2>&11 py登百度2 sitema url生成和py推分析“”:1 登录网址:https://passport.baidu.com/v2/?login 获得coo2017-04-06 09:23:593466
0