数据分析
文章平均质量分 94
卡林神不是猫
一枚大数据小学徒,正在大数据学习之路上摸索前行……
展开
-
数据分析案例(三):基于RFM分析的客户分群
在本次实验过程中,由于本人想要探究RFM-季度-数量之间的关系,而数据集是2010年12月1日到2011年12月9日的数据,导致在划分季度的时候,2011年12月的数据是4季度,2011年12月的数据也是4季度。这类群体的消费新近度高且订单金额高,但购买频率低,因此只要提升其购买频次,用户群体的贡献价值就会倍增。331(占比0.2):近期活跃高频低价值群体,企业应加强与他们的互动和沟通,提供个性化的优惠和推荐,深入分析他们的消费需求和习惯,并提供优质的客户服务,以维持和提升他们的消费价值和忠诚度。原创 2024-04-14 20:49:05 · 933 阅读 · 2 评论 -
数据分析案例(二):学生成绩数据的预处理、探索性分析和可视化
实验1 学生成绩数据的预处理、探索性分析和可视化1. 有60名学生的两门课程成绩的数据文件(文件名分别为ReportCard1和ReporCard2),分别记录着学生的学号、性别以及不同课程的成绩。请将数据读入Pandas数据框,并做如下处理:1)将两个数据文件按学号合并为一个数据文件,得到包含所有课程成绩的数据文件。2)计算每个同学的各门课程的总成绩和平均成绩。3)将数据按总成绩的降序排序。4)按性别分别计算各门课程的平均成绩。5)按优、良、中、及格和不及格,对平均成绩进行分组。原创 2024-04-13 20:30:35 · 1457 阅读 · 3 评论 -
数据分析案例(一):地区收入的PCA主成分分析
pd.read_csv(path,encoding=编码格式),注意这里的编码是gb2312。导入基础数据操作库包,PCA、k-means 库包,数据可视化库包。df[字段名].astype(新类型)特征工程标转化,高维数据转化为低维数据。练习1 地区收入的PCA主成分分析。df[字段列表],提取数值型的数据。选择曲线开始变得平坦的点作为K值。散点图显示聚类簇和特征变量关系。(列和 / 非空个数)将k值确定为肘部“4”原创 2024-04-12 19:25:56 · 809 阅读 · 1 评论