自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 浅谈商业数据分析 | 微观方法论

目录一、指标体系搭建1.1 什么是指标体系?1.2 如何搭建指标体系?1.3 APP的数据指标体系的一般构成二、流量分析2.1 渠道分析2.2 转化及价值分析2.3 流量波动分析一、指标体系搭建1.1 什么是指标体系?   指标体系是对产品业务数据进行分析和监控的前提。具体来说,是指在业务的不同阶段,由分析师牵头,业务方协助,指定的一套能从各维度反映业务业务状况的一套待实施框架。1.2 ...

2020-03-02 00:00:35 1117

原创 天池数据竞赛 | 工业蒸汽量预测(完整代码分享)

BY:乔木目录题目描述一、导入数据 | 观察数据二、特征工程三、模型训练模型1: Lasso回归模型2: 支持向量回归(SVR)模型3: XGB回归(XGBRegressor )四、模型评估五、模型预测题目描述比赛链接:工业蒸汽量预测赛题背景火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。 在这一系列的能量转化中,影响发电...

2020-02-29 18:27:49 16089 7

原创 游戏数据分析 | 用户流失原因分析

流失用户分析的方法有很多,常见的方法有流失等级分布、 等级停滞率、分渠道和平台的留存率对比、主线任务持有率。本文将从合理定义流失用户、客户端卸载原因和5W1H分析法来分析流失用户,并且用聚类分析对活跃用户进行细分,其目标在于更好地了解用户并满足用户需求,使游戏运营活动做到有的放矢,以提高游戏的盈利能力,推动收入的增长。目录一、合理定义流失用户用户多久没上线算流失?流失用户回归率拐点理论二、玩...

2020-04-02 20:43:57 6115

原创 极大似然估计与EM算法

极大似然估计与EM算法理解什么是极大似然估计(MLE)?​ 极大似然估计是建立在极大似然原理上的一种参数估计方法。其目的是利用已知的样本结果,反推最有可能导致这样结果的参数值。 通俗地说,就是通过若干次试验,观察其结果,利用试验结果得到某个参数值能够使样本出现的概率最大。极大似然估计的一般步骤:写出似然函数:估计参数θ的似然函数即各样本在θ条件下出现的联合概率分布概率密度函数L(θ...

2020-03-08 16:15:21 1429

原创 参数假设检验

目录一、基本思想二、两类错误三、检验步骤四、一个总体参数的检验总体均值的检验总体比例的检验总体方差的检验五、两个总体参数的检验两个总体均值之差的检验两个总体比例之差的检验两个样本方差比的检验两个样本方差比的检验一、基本思想​ 无论是怎样的假设,假设检验的思想是一样的,就是所谓概率性质的反证法。其根据是实际推断原理:小概率事件在一次试验中是几乎不可能发生的。进一步讲,要检验某假设H0,先假设H...

2020-03-07 21:41:52 2089

原创 主成分分析 (PCA) 的Python实现

一句话概括主成分分析主成分分析是采取一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关。这种将把多个变量化为少数几个互相无关的综合变量的统计分析方法就叫做主成分分析或主分量分析。主成分分析步骤对原始数据进行标准化处理计算标准化数据协方差矩阵求协方差矩阵的特征值和特征向量将特征值按照从大到小的顺序排序,选择其中...

2020-03-06 23:21:12 3739 5

原创 学习总结 | 逻辑回归(LR)

目录一、逻辑回归原理二、逻辑回归的优缺点三、逻辑回归特征问题3.1 逻辑回归为什么要对特征进行离散化?3.2 逻辑回归为什么常常需要特征组合?逻辑回归(Logistic Regression)是一种以回归的办法解决分类问题的广义线性回归模型,是研究二分类结果 yyy 与一些影响因素 (x1,x2,...,xn)(x_1,x_2,...,x_n)(x1​,x2​,...,xn​) 之间联系的一种...

2020-03-05 15:09:52 268

原创 学习总结 | 支持向量机(SVM)

目录1. SVM原理2. SVM核函数的作用与选择支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面(maximum-margin hyperplane)1. SVM原理...

2020-03-04 22:30:13 933

原创 SQL业务查询题 | 解题思路&代码分析

SQL是作为一名数据分析师必备的技能,在笔试/面试中我们经常会遇到各种SQL查询题,特别是对于工作相关的业务指标的计算。这篇文章中我将各种SQL业务查询题进行汇总。

2020-03-01 14:23:10 1516 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除