自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 假设检验方法-T检验、Z检验、F检验、卡方检验

假设检验问题是统计推断中的一类重要问题,小编在之前给大家整理,分享过假设检验的基本步骤,今天给大家带来的是常见的假设检验方法,希望对大家有所帮助。一、假设检验基本概念假设检验是用来判断样本与样本之间,以及样本与总体之间的差异,是由抽样误差引起的,还是本质差别造成的一种方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。其基本思想为小概率反证法思想。小概率思想认为小概率事件在一次试验中基本上不可能发生,在这种方法下,我们先对总体的特征作出某

2022-04-22 10:26:51 11598

原创 数据分析--ABtest

目录1、ABtest优势:2、正交实验VS互斥实验?1、ABtest优势:解决主观意见的分歧;快速试错,确定收益预期;刻画因果;建立数据驱动的闭环;降低风险,为迭代提供保障。2、正交实验VS互斥实验?正交实验:每个独立试验为一层,为保证各层之间互不影响,一份流量穿越每层试验时,会再次随即打散,且随机效果离散,这一过程叫做正交,这样的试验叫做正交试验。正交实验能够最大化的保证各层试验互相独立,确保各个试验不会相互影响。互斥实验:即为在同一层中拆分流量,且不论如何

2022-04-21 11:00:05 2341

原创 机器学习之集成学习

Boosting和bagging的区别集成学习根据各个弱分类器之间有无依赖关系,分为Boosting和Bagging两大流派:Boosting流派,各分类器之间有依赖关系,必须串行,比如Adaboost、GBDT(Gradient Boosting Decision Tree)、XgboostBagging流派,各分类器之间没有依赖关系,可各自并行,比如随机森林(Random Forest)样本选择上:Bagging:训练集是在原始集中有放回选取的,从原始集中选出的各轮训练集之间是独立的

2022-04-06 21:27:48 1057

原创 机器学习回归模型评价指标

回归模型的性能的评价指标主要有:RMSE(平方根误差)、MAE(平均绝对误差)、MSE(平均平方误差)、R2_score。先看看计算公式:1、MSE(平均平方误差、均方误差)均方误差是线性回归中最常见的损失函数,MSE可以评价数据的变化程度,MSE的值越小,说明预测模型描述实验数据有更好的精确度。2、RMSE(均方根误差、标准误差)标准误差是均方误差的算术平方根,开方后,误差的结果与数据是一个级别的。标准误差对测量中的离群点反映非常敏感。标准误差可以反映出测量的精密度。3

2022-04-01 16:09:56 8230

转载 ABtest如何确定样本量?

如何计算样本量商业分析的面试,很少会让面试者直接默写公式并进行计算。为啥?一,面试官八成自己也不记得公式。二,真实工作都是用网上的计算器,一键呵成,无需手算。网上随手找的的sample size计算器那么,我们现在来看看这个计算器的正确使用方法。这个计算器需要4个输入。有了这四个输入,就一定能够算出所需样本量。这四个输入分别是:Statistical power Significance level Baseline rate Minimum detectabl

2022-03-30 21:40:36 3551 1

原创 ABtest描述显著性

显著性,又称统计显著性(Statistical significance), 是指零假设为真的情况下拒绝零假设所要承担的风险水平,又叫概率水平,或者显著水平。即两组实验结果没有差异的情况下,我们确认为有显著性差异,即第一类错误的概率。显著性是一个概率值。...

2022-03-30 21:20:37 530

原创 ABtest描述统计功效

我们在面试数据分析时,常常会问到如何确定样本量的问题,会有一个指标:统计功效(power),或者是1-β统计功效会影响实验的可信度,甚至会影响实验所需的样本量,要了解统计功效,首先要理解两类统计错误假如我们做了一个AB实验,且两组用户的数据均值为μ1和μ2,我们会有两个初始假设:H0:两个实验组的数据没有差别(μ1=μ2),这个假设也叫“零假设”,也叫原假设H1:两个实验组之间的数据存在差别(μ1≠μ2),这个假设也叫“非零假设”,也叫备择假设定义两类错误:实验本身没有效应,但我们觉

2022-03-30 21:03:34 394

原创 常见机器学习优点和缺点

数据分析面试常考内容

2022-03-30 19:45:41 2755

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除