问题1:为什么要做假设检验
1、遇到一个问题
2、作出一个推断
3、总体的数据量太大,没法进行数据比较?抽样比较
4、通过抽样来推断整体
问题2 T检验和ANOVA的区别
ANOVA的基本原理:
1、实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和的总和表示,记作SSb,组间自由度dfb。
2、随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示, 记作SSw,组内自由度dfw。
t检验适用条件:
1、已知一个总体均数。
2、可得到一个样本均数及该样本标准差。
3、样本来自正态或近似正态总体。
(https://zhidao.baidu.com/question/569472887.html)
可以看到,T检验适用于总体均数已知情况下的组内分析(两组,三组及以上的自由度大于等于2时不适用);ANOVA可以分析多组的组间分析的情况,不需要知道总体均数(自由度大于等于2时候)。
ANOVA也可以分析两组的组内分析情况,但此时不如T检验方便。(因已知两组的均数,则总体均数已知,可用T检验)
问题3 两类错误分别适合的不同场景
(1)边际成本较小的线上营销推广时,弃真意味着丢失潜在用户,宁可犯第二类错误,扩大营销面,也尽量不丢失潜在用户。
(2)病人看病,原假设是健康的,但病人实际有病,接受了原假设,认为病人健康。这将引起灾难,因此要对二类错误严格,宁可多次复查最终确定。