数据分析与预处理

本文介绍了数据分析的关键步骤,包括数据探索的统计量分析和相关性分析,以及数据预处理的补充方法。在数据探索阶段,重点讲解了统计量如集中趋势和离散趋势的度量,以及通过散点图进行相关性分析。在数据预处理部分,提到了数据透视表和RFM模型在客户价值分析中的应用,以及RFM聚类分析的优势。此外,还涵盖了描述统计的要点,如频数、频率、集中趋势和离散程度分析。
摘要由CSDN通过智能技术生成

数据探索+ 数据预处理 

数据探索:
    1.统计量分析 :
        1.集中趋势的度量:
            1.均值、中位数、众数
        2.离散趋势的度量: 
            极值()
            极差
            标准差、方差
            四分位数间距 
    2.相关性分析:
        通过散点图  获取 相关系数

数据预处理:
    补充: 
        数据透视表 也可以对数据 进行分析 【聚合统计 】
        group by  +agg 
案例: 
    客户价值分析(用户画像  =》 类似 )

1.基本理论: 
    1.RFM模型
    2.聚类分析 (机器学习里面的算法 =》 结果 标签)
    3.RFM聚类分析    


1.RFM模型 =》 获取 RFM
    根据用户属性 进行打标签【进行分类 】 =》 
        超级用户
        普通用户
        黑户

    2.RFM: 【用户的属性】
        R: 最近一次消费 距现在的时长 【时差】 recency
        F:消费频率 frequency
        M:消费金额 mon

    eg:
        客户a :
            R:180  F:1次/月 M:100块

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值