自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 朴素贝叶斯法学习笔记

朴素贝叶斯学习过程和原理极大似然估计贝叶斯估计

2023-03-03 22:55:56 539

原创 L1和L2正则化为什么能缓解过拟合问题?

解释L1和L2正则化,以及二者之间的区别

2023-02-22 23:58:48 313

原创 (超详细一文看懂)MySQL累计求和问题及窗口函数order by的原理

总结一句话:在窗口函数里面,order by表面是排序,实际是求累计!

2020-07-17 22:35:38 8428 3

原创 数据清洗中异常值(离群值)的判别和处理方法

异常值甄别可能有很多方法,实际使用的时候感觉还是箱型图好用,一目了然,清晰易懂。

2020-07-03 20:25:01 47584

原创 某策略游戏(SLG)数据分析:新增、付费和活动效果评估

使用DC发起的游戏玩家付费预测算法大赛的数据,选择需要的字段分析游戏运营状况。主要内容包括新增用户分析、玩家付费分析、春节活动效果分析,主要使用的工具是python的pandas、matplotlib和seaborn包。文章既有代码也有思路。

2020-06-19 17:59:56 8644 33

转载 分析有道系列:如何搭建指标体系?(转载)

如何快速了解一个新行业,着手进行数据分析,我的方法基本就是在一些数据分析平台(如神策)上看指标。指标都是为业务服务的,当一个行业的指标在脑子里滚瓜烂熟的时候,基本上就能上手业务了,不至于说别人说了一个问题,自己连问题本身都不理解,更别提解决问题了。了解指标体系,就能够更好的拆解一个问题,更加细致的分析问题。从一些公司的面试问题来看,很多时候被面试者都会被问到:如果你是某某APP的数据分析师,你认为这个APP最重要的指标是什么?原因是什么?这个问题其实就等同于:你认为这个APP最重要的事情是什么?

2020-05-14 23:32:52 722

原创 分析有道系列:互联网用户行为分析的常用名词

互联网行业经过这些年的发展,内部的体系趋向于成熟,在数分领域也逐渐形成了一些常用的名词,在此对一些关于用户行为的名词进行介绍。本文主要的名词和解释来自于神策数据体系。1、指标指标就是具体的数值。比如独立访客数(UV)、页面浏览量(PV)、停留时长、转化率等都属于常见的指标。进一步细分的话,指标分为计数指标和复合指标。计数指标就是直接产生的,如UV、PV。复合指标是计算出来的,如转化率、跳出率...

2020-04-26 21:36:47 519

原创 行转列:python 和 My SQL 的实现方法

python可以用groupby和unstack的组合,以及groupby和pivot的组合实现行转列,也就是把一维表转为二维表。MySQL可以用group by结合case when进行行转列,以及使用if条件实现行转列。但总的来说,python强大太多了。

2020-04-19 23:08:16 442

原创 用My SQL查询连续的数字(连续出现问题)

最近在leetcode上刷题的时候,发现了一个比较有代表性的查询连续出现数字的问题。当然这个连续出现问题可以是很多,连续签到、连续登陆等。这个时候需要用到自连接,自连接也就是把一张表当两张表用。

2020-04-18 21:21:58 1269

原创 python聚类分析实现电商用户细分(基于RFM用户价值分析模型)

核心内容:使用python的sklearn的KMeans算法对电商用户进行分类。包含内容:数据概览、特征构建、k值选择、模型训练、可视化等。

2020-04-18 00:38:52 11932 30

原创 流量波动分析——系统思维(从案例入手)

夺命十三剑最厉害的是第十五剑,这是死亡之剑,也是地狱之剑。在第十五剑面前,再花哨的剑招也变得可笑。波动分析是数据分析师日常经常要面对的一个问题,电商平台、互联网公司经常面临流量波动,波动涉及的原因方方面面,比较复杂,如果没有掌握分析套路就一猛子扎进去开始分析,得出的结论不会太系统,容易遗漏。这里以一个网易的数据分析题目为例子,说说波动分析该怎么做。来源:网易2020数据分析笔试题当你发...

2020-04-12 00:23:55 1421

原创 用SQL提取用户首次下单的信息(金额、时间)

被打倒一次,你站起来了;两次,你又站起来了。我相信你能做到!可百次呢?千次呢?最近一直在刷一些数据分析的笔试题,在网易2020的校招题目中看到这样一道SQL题:用户第一单购买的行为往往反映了用户对平台的信任度和消费能力。现在数据库中有一张用户交易表order,其中有userid(用户ID)、amount(消费金额)、paytime(支付时间),请写出对应的SQL语句,查出每个用户第一单的...

2020-04-11 23:48:45 10894 2

原创 电商app用户行为分析(含全过程python代码)

一、分析背景        对于很多互联网公司来说,流量和用户价值都是核心问题。根据产品生命周期理论,在产品发布初期,更多的关注点应该放在拉新上,只有足够的用户量级才能为公司提供发展的不竭动力,初期对流量和市场份额的竞争,很大程度上决定了后期的行业格局。所以回顾滴滴和优步、美团和饿了么的烧钱大战,正是对“流量为王”这一理论的践行。但是流量进来之后呢?一个较...

2020-03-31 22:51:33 5515 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除