自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 [数据分析项目实战1-5]pandas利用透视表pivot_table构建用户RFM模型

以上的数据只是我们初步筛选过后的数据,我们要知道RFM可视为一个三维坐标系,用户要被映射到坐标范围在(0,1) 之间,那么指标就需要可比性,可计算行,首先我们需要将' or_date '这个日期属性转变一下,同时对列名进行更改。RFM模型用三个指标来对用户进行分类,可以将用户视作某个点在三维坐标系的位置,将指标的度量映射到(0,1)上,从而对用户进行可视化分类。现在关键的一步是如何将其映射到(0,1)上,怎么选取比较点,这里我们取指标的均值作为分割点,在进行转化。对用户数据进行数据表透视,获取目标信息。

2023-07-18 18:30:08 156 1

原创 [数据分析项目实战1-4]pandas的sort_values排序与cumsum累积计算

书接上回,我们现在有以下需求:1.挖掘用户的消费潜力,查看用户消费占比排序.2.绘制用户消费的累积曲线.为了让新来的朋友可以方便查看数据,我会将数据的字段信息放在开头.df.head()

2023-07-13 12:00:36 106 1

原创 [数据分析项目实战1-4]scatter相关性检验与hist用户消费分布

直方图的标记是hist,bins表示要分的份数,每一个柱状的宽度是最大值-最小值再除以bins,所以bins越大,柱状图越细,反之越粗。2.用户消费分布图:不同的消费等级人数分布。很明显的看出二者成正比例的关系,并且在统计周期内大部分用户的购买量在200以内,消费金额在3000以内。由图可以看出,消费次数较为集中,而消费金额有若干离散值,说明存在潜在的高消费用户。2.用户消费分布图:需要查看用户消费金额的总体分布以及基于用户的消费次数划分。用户的消费等级以及消费次数的分布,都是具有连续性,适合直方图。

2023-07-12 13:21:33 111 1

原创 [数据分析项目实战1-3]pandas中groupby分组计算与数据绘图

我们对数据进行按月分组,并提取出对应分析的字段进行求和或者计数。这里分组得到的数据是一个分组类型,他有两部分构成,一个是组别标题在这里就是不同的月份,还有就是其对于的数据,要想查看,需要循环遍历。大家好,今天给大家带来数据分析项目实战第三节内容,书接上回1-2,现在我们有如下需求:请对每月的消费金额,次数,数量,以及人数进行统计分析。

2023-07-11 18:29:04 290

原创 [数据分析项目实战1-2]时间序列的预处理 to_datetime,时间精度改变

大家好,有一段时间没有做更新了,近期找了一份实习,虽然不是很如意,但是还能凑合着吧,去大公司没人要,哈哈哈。

2023-07-11 17:45:57 51

原创 [数据分析--sql语法解析] sql中的排序问题---设置排名列

为什么要加上group by?如果不加上group by 就会输出一个记录,加上之后会对id进行分组查询,才能得到正确结果,但是为什么不加会只有一个输出呢,为什么只提取一个数据后就停止了?若按照升序方式排列即1,2,3...那么就得看大于他的有几个,那么初步思路已经有了,就是寻找比他大的得分有几个。,像这种对自身数据进行比较可以生成多个重复表进行不同命名的形式,然后进行非等值连接(因为是比较,肯定是非等值)要求输出一个按照score降序的排名结果,排名列为新列,且相同分数为同一名次,且保证排名连续。

2023-06-26 12:25:13 363 1

原创 [数据分析--SQL语法解析] Sql中limit函数使用与情景分析

在选取最值的适合使用可以提高效率,并且节约代码量,比如 ,选取工资第二高的工资,在这里我们用一下前一节的知识,再加一个条件,如果没有第二高的工资,则返回null.如果只传入一个参数,则为表示选取数量,起始位置默认为0.在选取记录的过程中,起始位置默认位置从0开始。limit 是指定读取范围数据跟使用游标进行逐行数据处理有着很暧昧的联系,关于这方面的知识点,敬请期待后期更新。Limit作为SQL 语句中重要的关键字,发挥着不可替代的作用,其含义是限制输出记录,或者可以说是选择性输出若干记录。

2023-06-25 21:09:57 722

原创 [数据分析--SQL语法解析] Sql中的ifnull函数以及相关函数解析

这是关于数据分析开设的第二个栏目,主要是用来解析sql在实际应用中出现的问题与细节,包含但不限于业务情景分析以及语句使用解析,在一定基础上进行针对性的回顾与提升,小伙伴们一起来吧!

2023-06-25 20:30:47 718

原创 [数据分析项目实战1-1]基于pandas的数据加载read与初步查看info/descibe

大家好,这是我跟大家分享的第一个栏目《数据分析项目实战1》。这是在实例项目的基础上对来学习python数据分析,与以往纯技术知识传授有所不同,可以让大家不仅了解基本的python语法还能体验python数据分析在实战中应用的具体情境,话不多说,接下来进入正题。发现无标题,且数据之间是由空格分开的,所以在加载的适合需要补上。在开始之前,我需要做一下数据来源声明,数据是《python数据分析5大实战项目...》的课程资料,b站可自搜。数据的加载依赖于不同的数据格式和数据内容,我们先查看数据的类型和结构。

2023-06-24 18:16:59 174

原创 小小白入坑

在这里,我将分享自己在学习过程中遇见的相关有趣的问题,来帮助总结自己,提升自己,同时希望能帮助到和我遇到一样困惑的同学,在交流中彼此提升。

2023-06-17 19:39:04 46 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除