Python
南瓜派PumpkinPie
这个作者很懒,什么都没留下…
展开
-
Python线程实例
由于项目要多次向接口发送请求获取数据,为了提高运行效率,研究了一下Python的线程和进程。两者运用于I/O密集型任务,但是线程运行效率高,共享内存,可以同时修改数据,缺点是受到Python语言自带的Global Interpreter Lock (GIL)限制;同时为了满足优点,还需要辅助工具比如锁,队列这样就很复杂,耗资源。进程内存独立,代码独立,能够充分利用GPU和内核,缺点是进程间无法交流...原创 2018-08-17 18:57:52 · 343 阅读 · 0 评论 -
python里的override(重写)
本文翻译自Let’s override什么是overrideoverride字面理解是无效,消除的意思,在Python里两个同名的方法但执行不同程序,其中一个方法使得另外一个方法无效的,这就叫override(重写)。 通常情况下,父类中的方法,而子类中有同名方法,在执行该方法时,调用的是该方法对应的类。 值得一提的是,这里父类和子类在原文中是superclass(总纲)和subc...翻译 2018-09-09 13:39:44 · 19605 阅读 · 3 评论 -
python数据挖掘-oneR算法
以下参考自《python数据挖掘入门与实战》1.4分类已知类别的数据集,经过训练得到一个分类模型,再用模型对类别未知的的数据进行分类。比如垃圾邮件过滤器离散化:数据集的特征为连续值,算法使用类别性特征值,连续值转变为类别值,这个过程叫离散化最简单的离散化算法:确定一个阈值,低于该阈值的特征设置为0,高于阈值的值设置为1阈值计算方法之一:该特征的所有特征值的均值oneR算法对于每个特征...转载 2019-02-28 17:15:27 · 462 阅读 · 0 评论 -
Python数据挖掘-亲和性分析
以下参考自《python数据挖掘入门与实战》1.3亲和性分析这个国内又叫做关联分析,根据样本个体之间相似度,确定他们关系的亲疏,适用于推荐商品推荐思路:人们经常同时购买两种商品,以后也会同时购买规则:如果一个人购买了商品X,那么他很可能购买Y规则优劣衡量的标准:支持度和置信度支持度(support):规则应验次数,除以规则有效下总数量,衡量的是规则应验比例。support = 同时...转载 2019-02-28 17:30:55 · 457 阅读 · 0 评论 -
pandas做统计分析
目的:了解市场上6月份男鞋销售情况import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdf = pd.DataFrame(pd.read_excel('6月男鞋数据.xlsx')) #导入数据print(df.head()) #打印前5列,查看数据结构data = df.iloc[:,:19] ...原创 2019-02-28 18:26:39 · 554 阅读 · 0 评论 -
Python编码问题详解
当你在进行读写操作出现如下报错UnicodeEncodeError: ‘utf-8’ codec can’t encode character ‘\u704f’ in position 0或者乱码,那么看这篇文章是对的什么是编码和解码计算机只认识0或1组成的二进制数,而人类只认识文字,必须要有一个从文字到0,1的映射。从文字到0,1的映射称为编码,反过来从0,1到文字叫解码编码和解...原创 2019-07-24 19:44:54 · 484 阅读 · 0 评论 -
用户流失预测——基于逻辑回归模型以及Python代码实现
研究目的有效预测当前用户是否流失,针对高价值的潜在流失用户进行精细化运营以此挽留目标用户。用户流失预测2.1用户流失定义流失用户:上一个周期有下单而本周期没有下单的用户非流失用户:上一个周期和本周期都有下单的用户2.2用户流失率以一个季度为周期,用户流失率指的是上一个周期有下单而本周期没有下单的用户数与上一个周期有下单的用户之比。下图为近四个周期的用户流失率,平均流失率为19.76...原创 2019-07-25 15:24:33 · 10980 阅读 · 5 评论