数据挖掘
文章平均质量分 74
数据挖掘
adamyoungjack
师傅领进门,修行看个人。
展开
-
ab实验
1. 简介1.1 定义在工作和互联网大厂中经常被用来验证一个功能最终是否会被上线的重要手段1.2 原理来源于假设检验比如,现在有两个同质的样本组,对其中一个组做出某种改动观测这个改动对于我们关注的核心指标是否有显著的影响这个实验中原假设就是这项改动并不会对我们所关注的核心指标有显著的影响如果做完这个实验后发现p值足够小,则推翻原假设,证明这项改动会对多关注的核心指标产生显著影响1.3 本质同质样本组的对照实验2. 辛普森悖论2.1 定义在某种条件下所关注的两组数据分别原创 2021-01-06 23:12:44 · 2492 阅读 · 0 评论 -
Numpy
1. 简介1.1 Numpy简介Numpy(Numerical Python)是一个开源的Python科学计算库,用于快速处理任意维度的数组。Numpy 支持常见的数组和矩阵操作。对于同样的数值计算任务,使用Numpy比直接使用Python要简洁的多。Numpy 使用ndarray对象来处理多维数组,该对象是一个快速而灵活的大数据容器。1.2 ndarray简介NumPy provides an N-dimensional array type, the ndarray, which des原创 2020-12-05 20:54:14 · 838 阅读 · 0 评论 -
Pandas
5.1Pandas介绍学习目标目标了解什么是pandas了解Numpy与Pandas的不同知道使用pandas的优势1. 简介1.1 定义2008年WesMcKinney开发出的库专门用于数据挖掘的开源python库以Numpy为基础,借力Numpy模块在计算方面性能高的优势基于matplotlib,能够简便的画图独特的数据结构1.2 优势Numpy已经能够处理数据,并且结合matplotlib解决部分数据展示等问题增强图表可读性回忆我们在numpy当中创建学生成绩原创 2020-12-14 14:20:04 · 351 阅读 · 0 评论 -
Pandas高级处理
1. 缺失值1.1 简介1.2 处理1. 判断是否包含NaN判断数据中是否包含NaN:pd.isnull(df)pd.notnull(df)获取缺失值的标记方式(NaN或者其他标记方式)2. 如果缺失值的标记方式是NaN存在缺失值nan:1、删除存在缺失值的:dropna(axis=‘rows’)注:不会修改原数据,需要接受返回值2、替换缺失值:fillna(value, inplace=True)value:替换成的值inplace:True:会修改原数原创 2020-12-26 21:56:07 · 319 阅读 · 0 评论 -
RFM会员价值度模型
1. 简介1.1 作用会员价值度用来评估用户的价值情况,是区分会员价值的重要模型和参考依据,也是衡量不同营销效果的关键指标之一。1.2 定义价值度模型一般基于交易行为产生,衡量的是有实体转化价值的行为。常用的价值度模型是RFMRFM模型是根据会员最近一次购买时间R(Recency)购买频率F(Frequency)购买金额M(Monetary)计算得出RFM得分通过这3个维度来评估客户的订单活跃价值,常用来做客户分群或价值区分RFM模型基于一个固定时间点来做模型分析,不同时间计算的原创 2020-12-14 19:11:05 · 3283 阅读 · 2 评论