自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (2)
  • 收藏
  • 关注

原创 泰坦尼克号数据分析案例实战

这是一个很经典的案例,很多博主都写过,对,就是它:泰坦尼克号生存率的分析,它是kaggle上的一道题,通过船上乘客的信息分析和建模,预测哪些乘客得以生还。我们就非常粗暴地拿这个数据集做一个简单的分析好了。使用工具:Excel(对,就是这么简单粗暴)一、明确目的1912年泰坦尼克号撞上冰山沉没,船上2224名乘客和机组人员中有1502人遇难,幸存下来的人是出于运气还是存在一定的规律?这是我们比较关心的,所以就要提出问题:那些人士生还的可能性大?其次了解数据,数据集总共有以下的字段

2020-05-23 11:56:21 8549

原创 5月小复盘

5月小复盘写在前面月底了来做一个小复盘吧。发文5月至今发了12篇文章,其中8篇原创,3篇投稿,1篇转载,按7日阅读量降序排列,欢迎大家再次阅读(剔除随笔类文章):泰坦尼克号数据分析 37...

2020-05-30 19:30:00 107

原创 数据分析应关注AARRR模型的哪些指标

AARRR模型就是Acquisition(获取) Activation(活跃) Retention(留存) Revenue(收益) Refer(传播)这5个单词的缩写,对应用户生命周期中5个重要的环节,其实就是一个漏斗模型,每一个环节要怎么做不是我们讨论的重点,这篇文章是要来梳理一下AARRR模型关注的指标。1、Acquisition:获取用户首先是获取用户的阶段,用户从何处得知你的存在?通用指标是曝光量、点击量(率)、用户获取成本等,以微信公众号为例,这里比较关注的是新关注.

2020-05-30 16:28:44 872

原创 《深入浅出数据分析》读后感

好久没有更新读书系列的文章了,今天推荐的这本《深入浅出数据分析》是一本非常适合数据分析行业入门的读物,以章回小说的方式由浅入深地讲述数据分析从业人员要用到的方法,从实际案例出发,告别晦涩难懂的概念。文章末尾有关于这本书的知识图谱总结。深入浅出系列,同系列的还有《深入浅出统计学》、《深入浅出Python》、《深入浅出SQL》等,当然这本书读完以后强烈建议接着读《深入浅出统计学》,加深对数据分析和统计学的理解和巩固。作者:[美] Michael Milton豆瓣评分:7.5出版日期:2012年推荐

2020-05-27 20:13:52 2541

原创 深入浅出数据分析

好久没有更新读书系列的文章了,今天推荐的这本《深入浅出数据分析》是一本非常适合数据分析行业入门的读物,以章回小说的方式由浅入深地讲述数据分析从业人员要用到的方法,从实际案例出发,告别晦涩难...

2020-05-25 08:32:00 276

原创 泰坦尼克号数据分析

这是一个很经典的案例,很多博主都写过,对,就是它:泰坦尼克号生存率的分析,它是kaggle上的一道题,通过船上乘客的信息分析和建模,预测哪些乘客得以生还。我们就非常粗暴地拿这个数据集做一个...

2020-05-22 08:24:00 3709

原创 关于学习时间的一点小感悟

hello大家好,我可乐又回来了!刚肝完一篇文章,今年要做一个不拖稿的可乐!首先非常感谢给我安慰鼓励和支持的你们,上一篇有点丧的文章发出后收到了很多小伙伴的爱心慰问,突然发现这两年的公众号...

2020-05-20 08:30:00 117

原创 Python实现LRFM模型分析客户价值

作者:Dake1. 分析背景 这是一份某电商平台的销售数据,数据包含2010年4月22到2014年7月24的销售数据。分析该销售数据,可以发现客户价值。现利用KMeans聚类实现LRFM模...

2020-05-16 19:07:00 312

原创 Python数据分析:探索性分析

写在前面如果你忘记了前面的文章,可以看看加深印象:Pandas数据处理Python数据分析实战:缺失值处理Python数据分析实战:获取数据然后可以进入今天的正文一、描述性统计分析Excel里可以用【数据分析】功能里的【描述统计】功能来查看数据集常用的统计指标,但这里只能是对数值型的数据进行统计。pandas里可以用describe方法对整个数据集做一个描述性统计分析,...

2020-05-16 10:21:07 989

原创 一份电商数据分析案例

作者:Dake1. 分析背景这是一份巴西Olist(2016年8月-2018年8月)电商数据平台的数据。这里只筛选了2017-2018年的数据来进行分析。分析该数据可以看出近两年的销售业绩...

2020-05-08 19:23:00 2237

原创 Python数据处理

一、查找重复值既然我们这个系列是对比Excel,那么在Excel里是怎么查找重复值的呢?有很多种方法,这里就简单说一种:条件格式。在【开始】——【条件格式】里选择突出显示重复值,就将重复的值突出显示出来了:Pandas里如何查找重复值呢?1、查找所有列duplicated方法查找重复值,和isnull一样,得到的结果是布尔值,如果重复被标记为True,否则为Fal...

2020-05-04 20:07:59 4975 1

原创 pandas数据处理

一、查找重复值 既然我们这个系列是对比Excel,那么在Excel里是怎么查找重复值的呢?有很多种方法,这里就简单说一种:条件格式。在【开始】——【条件格式】里选择突出显示重复值,就将重复...

2020-05-04 19:40:00 83

可乐的SQL速查文档.pdf

SQL基础知识点汇总

2021-05-15

可乐的数据分析学习宝典.pdf

内容包含Excel基础、可视化、SQL、Python、统计学、数据分析类书籍的读书笔记、笔试面试题等,数据分析学习手册

2021-04-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除