数据分析厂长-CSDN博客

原创假设检验方法-T检验、Z检验、F检验、卡方检验

假设检验问题是统计推断中的一类重要问题，小编在之前给大家整理，分享过假设检验的基本步骤，今天给大家带来的是常见的假设检验方法，希望对大家有所帮助。一、假设检验基本概念假设检验是用来判断样本与样本之间，以及样本与总体之间的差异，是由抽样误差引起的，还是本质差别造成的一种方法。其基本原理是先对总体的特征作出某种假设，然后通过抽样研究的统计推理，对此假设应该被拒绝还是接受作出推断。其基本思想为小概率反证法思想。小概率思想认为小概率事件在一次试验中基本上不可能发生，在这种方法下，我们先对总体的特征作出某

2022-04-22 10:26:51 11657

原创数据分析--ABtest

目录1、ABtest优势：2、正交实验VS互斥实验？1、ABtest优势：解决主观意见的分歧；快速试错，确定收益预期；刻画因果；建立数据驱动的闭环；降低风险，为迭代提供保障。2、正交实验VS互斥实验？正交实验：每个独立试验为一层，为保证各层之间互不影响，一份流量穿越每层试验时，会再次随即打散，且随机效果离散，这一过程叫做正交，这样的试验叫做正交试验。正交实验能够最大化的保证各层试验互相独立，确保各个试验不会相互影响。互斥实验：即为在同一层中拆分流量，且不论如何

2022-04-21 11:00:05 2348

原创机器学习之集成学习

Boosting和bagging的区别集成学习根据各个弱分类器之间有无依赖关系，分为Boosting和Bagging两大流派：Boosting流派，各分类器之间有依赖关系，必须串行，比如Adaboost、GBDT(Gradient Boosting Decision Tree)、XgboostBagging流派，各分类器之间没有依赖关系，可各自并行，比如随机森林（Random Forest）样本选择上：Bagging：训练集是在原始集中有放回选取的，从原始集中选出的各轮训练集之间是独立的

2022-04-06 21:27:48 1059

原创机器学习回归模型评价指标

回归模型的性能的评价指标主要有：RMSE(平方根误差)、MAE（平均绝对误差）、MSE(平均平方误差)、R2_score。先看看计算公式：1、MSE(平均平方误差、均方误差)均方误差是线性回归中最常见的损失函数，MSE可以评价数据的变化程度，MSE的值越小，说明预测模型描述实验数据有更好的精确度。2、RMSE(均方根误差、标准误差）标准误差是均方误差的算术平方根，开方后，误差的结果与数据是一个级别的。标准误差对测量中的离群点反映非常敏感。标准误差可以反映出测量的精密度。3

2022-04-01 16:09:56 8238

转载 ABtest如何确定样本量？

如何计算样本量商业分析的面试，很少会让面试者直接默写公式并进行计算。为啥？一，面试官八成自己也不记得公式。二，真实工作都是用网上的计算器，一键呵成，无需手算。网上随手找的的sample size计算器那么，我们现在来看看这个计算器的正确使用方法。这个计算器需要4个输入。有了这四个输入，就一定能够算出所需样本量。这四个输入分别是：Statistical power Significance level Baseline rate Minimum detectabl

2022-03-30 21:40:36 3568 1

原创 ABtest描述显著性

显著性，又称统计显著性（Statistical significance），是指零假设为真的情况下拒绝零假设所要承担的风险水平，又叫概率水平，或者显著水平。即两组实验结果没有差异的情况下，我们确认为有显著性差异，即第一类错误的概率。显著性是一个概率值。...

2022-03-30 21:20:37 530

原创 ABtest描述统计功效

我们在面试数据分析时，常常会问到如何确定样本量的问题，会有一个指标：统计功效（power），或者是1-β统计功效会影响实验的可信度，甚至会影响实验所需的样本量，要了解统计功效，首先要理解两类统计错误假如我们做了一个AB实验，且两组用户的数据均值为μ1和μ2，我们会有两个初始假设：H0：两个实验组的数据没有差别（μ1=μ2），这个假设也叫“零假设”，也叫原假设H1：两个实验组之间的数据存在差别（μ1≠μ2），这个假设也叫“非零假设”，也叫备择假设定义两类错误：实验本身没有效应，但我们觉

2022-03-30 21:03:34 396

原创常见机器学习优点和缺点

数据分析面试常考内容

2022-03-30 19:45:41 2759

qq_38134556的博客