数据分析
文章平均质量分 89
开出南方的花
这个作者很懒,什么都没留下…
展开
-
数据处理与统计分析篇-day11-RFM模型案例
会员价值度用来评估用户的价值情况,是区分会员价值的重要模型和参考依据,也是衡量不同营销效果的关键指标之一。价值度模型一般基于交易行为产生,衡量的是有实体转化价值的行为。常用的价值度模型是RFMRFM模型是根据会员最近一次购买时间R(Recency)购买频率F(Frequency)购买金额M(Monetary)计算得出RFM得分通过这3个维度来评估客户的订单活跃价值,常用来做客户分群或价值区分RFM模型基于一个固定时间点来做模型分析,不同时间计算的的RFM结果可能不一样。原创 2024-09-27 18:18:09 · 609 阅读 · 0 评论 -
数据处理与统计分析篇-day08-apply()自定义函数与分组操作
在SQL中我们经常使用 GROUP BY 将某个字段,按不同的取值进行分组,在pandas中也有groupby函数, 分组之后,每组都会有至少1条数据, 将这些数据进一步处理,返回单个值的过程就是聚合,比如分组之后计算算术平均值, 或者分组之后计算频数,都属于聚# 需求: 计算各个大洲的平均寿命# 方式1: 使用Pandas的mean()函数.# 方式2: 使用自定义函数, 计算平均值.# 1. 定义函数, 计算某列的平均值.# 某列平均值 = 该列元素和 / 该列元素个数。原创 2024-09-22 20:41:23 · 1113 阅读 · 0 评论 -
数据处理与统计分析篇-day07-Pandas数据拼接与空值处理
concat()函数既能实现行拼接(默认), 也能实现列拼接.行拼接参考: 列名, 列拼接参考: 索引列(行索引)格式: pd.concat([df1, df2, ...], ignore=是否重置索引, axis=行/列)默认: 满外连接, 即: 两个df的全集 + 交集格式:df.merge(df2, on='关联字段', how='连接方式', suffixes=(左表后缀, 右表后缀))参数:参1: 要被合并的df对象.原创 2024-09-20 20:59:14 · 1181 阅读 · 0 评论 -
数据处理与统计分析篇-day07-Pandas数据分析案例
tmp_df.house_num.plot(kind='bar', figsize=(20, 10)) # 柱状图, 宽高。# df.groupby('house_type')['view_num'].sum() # Series对象。df.groupby('house_type')[['view_num']].sum() # df对象。tmp_df.plot(kind='bar', figsize=(20, 10)) # 柱状图, 宽高。原创 2024-09-20 14:40:30 · 1155 阅读 · 0 评论 -
数据处理与统计分析篇-day06-Pandas数据分析入门
1. 读取文件, 获取df对象.df.head()。原创 2024-09-19 20:59:26 · 1302 阅读 · 0 评论