- 博客(8)
- 资源 (3)
- 收藏
- 关注
原创 一般数据挖掘流程
1.业务需求2.数据分析3.数据处理4.模型搭建5.模型评估1.业务需求业务背景业务目标业务问题关键点(痛点)数据口径与维度目标产出内容2.数据分析基本分析方法:数据分布、数据对比、数据象限、数据相关性、数据辨别分析、数据结构化拆分等;统计基本信息:最大最小值、中位数、分位数、均值等;基本统计检验:T检验、F检验、卡方检验、Z检验、非参检验。单个特征可视化: 对单个特征以及目标特征的各个取值情况做计数,绘制分布图(离散变量:条形图;连续变量:概率分
2020-12-24 11:58:49
1033
原创 风控评分卡模型——逻辑回归
目录1.评分卡模型解释2.评分卡模型一般开发流程3.探索性数据分析4.数据预处理5.特征选择6.构建逻辑回归模型7.模型评价8.转化为评分卡9.SEM评分卡数据集:本文所使用的数据来源于美国P2P公司Lending Club所开源出来的,可以通过链接:1.评分卡模型解释一个用户总的评分等于基准分加上对客户各个属性的评分。客户评分=基准分+年龄评分+性别评分+婚姻状况评分+收入评分如某客户年龄为27岁,性别为男,婚姻状况为已婚,月收入为20000,那么.
2020-12-17 16:24:09
3727
原创 如何预测(计算)用户价值—BG/NBD模型
BG/NBD模型介绍:设时间段T中的交易次数x,T的第一个交易的时间t0为起点,最后交易的时间为tx,在时长为t的时间内的交易数的(总)期望值在时长为t的时间内,交易数量为x的(总)概率在时长为(T, T+ t]的时间中,一位顾客(x = x, t, T)的交易数的期待值假设:一个活跃顾客在长度为t的一段时间内的交易量服从交易率λ的泊松分布。顾客中交易率λ的非均匀性和服从形状参数r,比例参数α的gamma分布。每次交易后客户变得不活跃的概率为 p,客户退出点服从二...
2020-12-14 11:37:33
3567
原创 基于相似度的推荐算法展开
目录1. 推荐算法的种类2.基于相似度的推荐算法3.基于行列分解的推荐算法4. 基于贝叶斯的行列分解推荐算法5.行列分解的非线性扩张6. 通过推荐算法提升用户的生命周期1. 推荐算法的种类协同过滤 内容过滤 统合过滤...
2020-10-21 22:17:13
1361
原创 干货 | 一文读懂数据分析
文章目录一、常用数据分析模型 二、产品运营模型 三、市场营销模型 四、流量模型 五、电商和消费模型 六、用户行为模型一、常用数据分析模型产品运营模型:以移动端APP为主体,以AAARR模型为主,包括Acquisition用户获取、Activation用户活跃、Retention用户留存、Revenue收入、Refer传播,以及细分指标。市场营销模型:以传统的市场营销方法论为基底,包括用户生命周期,生命周期价值、用户忠诚度、用户流失率、用户留存率、用户RFM价值等功能的相关指.
2020-10-14 00:20:43
710
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人