数据分析
文章平均质量分 74
「已注销」
路漫漫远兮,吾上下求索
展开
-
数据分析:留存率曲线拟合
留存率,在数据分析中,我认为是一个比较好用的指标,因为比较稳定,不会很容易受外界因素的干扰,大幅波动。例如活动,推广等。可以用来做用户的分类,做用户规模预测。我们看到的留存曲线通常是这样的:这里介绍几种留存率曲线拟合的方法:1.用excel 拟合:拟合样本,1日~12日留存率,画好曲线图后,为曲线图添加趋势线,选择对数或者幂函数(通常对数比较多),显示公式和R平方值,R平方原创 2017-03-22 11:44:36 · 15119 阅读 · 1 评论 -
数据处理:数据的几种简单处理
在现实使用数据的过程中,常常会遇到数据缺失,需要对数据进行采样,不同指标数据差异太大,这都需要对数据做预处理,下面是几种简单的数据处理方法:这里用到的是scikit-learn中preprocessing这个模块和numpy 1.修补数据 from sklearn.preprocessing import Imputer2.数据随机采样3.数据缩放 from sklearn.pr原创 2017-04-01 16:03:21 · 7335 阅读 · 1 评论