- SQL中,inner join连接,结果是2张表的共同信息。
- SQL中,full join连接,结果是2张表的全部信息。
- row number() over(partition by) 是oracle数据库的高级函数。
- 主成分分析算法认为,数据的信息包含在方差之中。
- 相关系数矩阵是随机变量标准化的协方差矩阵,它仅保留了指标间的相关性。协方差矩阵适合研究单个指标的方法对于结果的影响。
- 在因子分析中,我们可以使用因子旋转来使得最终得到的因子具有解释性。
- 对应分析中,由于进行降维展示,因此原来的信息会受到一定的损失,导致信息不完整。
- 如果多元线性回归模型中残差不等于0,而是一个常数,那么这个常数一定在常数项里。
- 当变量存在共线性时,wald检验结果不可靠。
- 如果偏自相关函数ACF在n阶之后迅速趋近于0,那么就是ACF具有n阶截尾性。
- 数据挖掘偏重于预测,统计模型偏重于关系发现。
- 皮尔逊系数越低,P值越大,其相关性不显著。
- 区间估计的核心作用是评价点估计的可靠性。
- 判断类别对于数值变量是否有显著影响,可以用MS,F,和P-value。
- 先行处理不会改变异方差,非线性才会改变。
- 组内自由度等于观察数减去组数。
- 面板数据是指时间序列上取多个截面。意味着在一段时间内,类别多余2个。
- 小样本均值检验用t检验。
- 不对称,切比雪夫不等式,75%在2个标准差,89%在3个标准差,94%在4个标准差。
- 在数据建模前,尽量保留数据的原始信息。
CDA1级习题复习(2)
最新推荐文章于 2024-04-29 10:12:10 发布