自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 资源 (1)
  • 收藏
  • 关注

原创 Kaggle数据分析实战之 E-commerce - Users of a French C2C fashion store

1.项目介绍随着社交网络和电商平台的快速发展,用户数据的海量累积,数据分析师需要从中挖掘数据价值,进而创造商业价值。本项目的目的是通过分析法国某C2C时尚电商平台的用户数据,挖掘用户流失行为背后原因,希望能为C2C导向的电商平台带来些许提示。项目数据来源自kaggle(数据地址提取码:cobp)。本项目以Mysql为主要分析工具。2.局限性项目中所使用的数据集仅涉及完整用户数据的一部分,不涵盖近期的用户数据,最近期的用户注册日期距离数据收集日期也有7.92年之久。因此,数据本身的‘古老性’.

2020-08-27 12:30:40 1192 1

原创 淘宝用户行为分析Tableau可视化展示

Tableau真是太有趣了。

2020-05-07 10:24:13 2191

原创 数据分析实战之淘宝用户行为分析(5) - 数据分析报告

数据分析实战之淘宝用户行为分析(5) -数据分析报告数据分析实战之淘宝用户行为分析(4) -用户购买行为分析 数据分析实战之淘宝用户行为分析(3) -用户行为路径分析 数据分析实战之淘宝用户行为分析(2) -用户行为数据分析 数据分析实战之淘宝用户行为分析(1) -数据清洗1.目的本项目基于阿里天池提供的数据,通过挖掘用户行为,分析用户行为的规律与特点,进而实现购买转化...

2020-05-01 23:20:18 2729

原创 数据分析实战之淘宝用户行为分析(4) -- 用户购买行为分析

数据分析实战之淘宝用户行为分析(4) -- 用户购买行为分析①最受欢迎的十类商品② 复购率 (有多次在平台上购买的行为)③不同行为下的购买率嘿嘿。...

2020-05-01 13:39:25 1939 1

原创 数据分析实战之淘宝用户行为分析(3) -- 用户行为路径分析

数据分析实战之淘宝用户行为分析(3) -- 用户行为路径分析①用户行为转化率 (PV)②用户行为转换率 (UV)③跳失率分析嘿嘿。...

2020-05-01 13:29:48 1746

原创 数据分析实战之淘宝用户行为分析(2) -- 用户行为数据分析

数据分析实战之淘宝用户行为分析(2) -- 用户行为数据分析1. PV分析2.UV分析

2020-05-01 12:28:55 1540 1

原创 数据分析实战之淘宝用户行为分析(1) -- 数据清洗

一步步做完收获颇多,记录分享。数据来自阿里天池。淘宝用户行为分析(1) - 数据清洗1.导入数据。发现由于Timestamp数据过长,Timestamp以科学计数法显示。①将Timestamp调整为正常的时间戳格式2.观察数据,进行初步清洗。①处理空值②处理重复值③将时间戳转换为日期格式④处理异常值以年为维度观察数据...

2020-04-30 23:59:03 2713 2

原创 《游戏数据分析的艺术》学习笔记之游戏数据指标汇总

1. Acquisition用户获取DNU: 日新登用户数DOSU:日一次会话用户数2. Activation 用户活跃DAU:日活跃用户数WAU:周活跃用户数MAU:月活跃用户数DEC:日参与次数DAOT:日均使用时长...

2020-04-28 11:49:05 501

原创 机器学习之通俗快速了解决策树

如何拥有一棵决策树决策树为什么叫决策树:↓↓↓↓↓↓↓↓ ①可以用来做决策,做预测 ②长得就像一棵树 ↓↓↓↓↓↓↓↓↓那么该如何构建一棵你自己的决策树呢?决策树结构:除了知道决策树是一棵逆引力生长的树,还需要知道根节点:顾名思义,像根一样的节点,即起始节点 非叶子节点(决策点):就是岔路口,决定通向哪个决策的节点,再通俗一点说就是下面还有分支的节点 ...

2020-04-27 21:40:36 243

原创 数据分析方法论之AARRR模型

漏斗模型(AARRR)学习笔记又是不能不知道系列AARRR:Acquisition(获取)、Activation(活跃)、Retention(留存)、Revenue(收益)、Refer(传播)如果你要想记住必须跟我一起念,如果你要想记住必须跟我一起念。AARRR,获取活跃留存收益传播。AARRR,获活留收传。AARRR,嚯嚯六艘船。嚯嚯六艘船在手,用户分析你有。(恭喜我...

2020-04-23 21:52:28 1151

原创 数据分析方法论之RFM模型

RFM模型学习笔记听说是不能不知道经典模型

2020-04-21 11:02:18 789

原创 Leetcode刷题记之游戏玩法分析V

报告每个安装日期、当天安装游戏的玩家数量和第一天的保留时间题目来源:Leetcode 1097预期输出结果:读题:①安装日期:每个玩家第一次登陆日期;②当天安装游戏的玩家 ③第一天的保留时间:次日留存率①安装日期:最小日期即为首次登陆日期SELECT MIN(event_date) install_dt,player_idFROM activity...

2020-04-20 17:07:47 252

原创 数据分析方法论之TGI指数

TGI指数(偏好度)学习笔记看了许多讲TGI指数文章,嗯,得总结一下学习笔记,不然很可能是我被我脑子骗了。你以为你懂了,其实你不懂。 咱们从后往前倒推:1.拿到TGI指数,该看什么? >>>>> 拿TG...

2020-04-19 19:04:07 6997

原创 Leetcode刷题记之学生地理信息报告

学生地理信息报告:实现对大洲(continent)列的透视表操作题目来源:Leetcode 618什么叫做对continent列的透视表操作?即,按照continent列对学生信息进行汇总,期望输出结果:对照原数据表,可以明确一个大致的解题思路:行转列①尝试行转列SELECT (CASE WHEN continent='America' THEN name ...

2020-04-19 10:04:18 242

原创 Leetcode刷题记之平均工资:部门与公司比较

比较部门平均工资与公司平均工资题目来源:leetcode 615解题思路:求出每个部门的平均工资 --->求出公司的平均工资 ---->两者关联对比① 求出每个部门的平均工资SELECT substr(pay_date,1,7) pay_month, department_id, AVG(amount) avg_deptFROM salary a, em...

2020-04-18 20:27:09 321

原创 Leetcode刷题记之给定数字的频率查询中位数

给定数字的频率查询中位数题目来源:Leetcode方法一:解题思路:中位数顺序 = (总个数+1)/2解答:SELECT AVG(number) medianFROM (SELECT a.Number, a.Frequency, SUM(b.frequency) cumttl FROM Numbers a,Numbers b WHERE a.Numb...

2020-04-17 12:11:11 406

原创 分布式文件系统之DFS复制、命名空间和NameNode

什么是分布式文件系统?百度百科:分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点(可简单的理解为一台计算机)相连。分布式文件系统的设计基于客户机/服务器模式。一个典型的网络可能包括多个供多用户访问的服务器。另外,对等特性允许一些系统扮演客户机和服务器的双重角色。意思就是,原本存在本地的...

2020-04-16 11:00:13 2520

原创 Cloud Computing 初见云计算

什么是云计算?百度百科解释为:“云计算(cloud computing)是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,然后,通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。”用通俗的话来说,云计算:云:代表了无所不在的,可以提供资源的网络,就像你头顶上的云一样可以无所不在,笼罩四方。计算:高效,方便,庞大的计算量,反正就是牛...

2020-04-15 21:47:22 421

原创 Leetcode刷题记之员工薪水中位数

查找每个公司的薪水中位数题目来源:LeetcodeEmployee表包括所有员工。包含三列:员工Id, 公司名和薪水思路: 如果是奇数长度,那么 大于中位数的个数 = 小于中位数的个数解答:SELECT a.Id, a.Company, a.SalaryFROM Employee a, Employee bWHERE a.Company = b.CompanyGROUP B...

2020-04-15 18:15:39 593

原创 大数据技术入门之分布式处理、并行处理和MapReduce

什么是大数据?百度百科解释为:“是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。”有点高级有点绕。简化一下,大数据就是拥有很高价值不能轻易被推到(咳)处理的数据集合。就像你要去打一个数据究极体的boss,你需要带上最好的剑,翻过最高的山,闯进深的森林。boss挂了,自然...

2020-04-14 11:23:47 2195

游戏数据指标.png

学习资料:把所有游戏数据常用指标以及其适用场景、用途以思维导图的形式总结。(来自<<游戏数据分析的艺术>>)

2020-05-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除