- SQL编程专题:【数据分析/商业分析】面试题整理——SQL专题
统计学
- 怎么做假设检验
- 偏态分布怎么处理
- 假设检验的基本原理,为什么会是反证的思想
- 假设检验的p值,显著性水平是什么,怎么理解
- 实验的样本量怎么确定
- 卡方,z,t检验的使用场景区别
- 如何和一个没有统计背景的人解释MLE
- 如果实验组、对照组的流量分配不均匀,如何消除影响
- 解释大数定律,中心极限定理
10.皮尔森相关系数以及如何解读相关、独立、线性相关的区别
机器学习
- 两个向量之间的相似性有哪些计算方法
①欧氏距离
②曼哈顿距离
③余弦相似度
④杰卡德相似度 - 逻辑回归:特点、归一化吗
- 完整解释PCA,PCA缺点:高维度数据能使用PCA吗,类别变量onehot能用PCA吗
- 特征工程怎么做
- ensemble怎么做,怎么提高ensemble的表现
- 模型评估指标选择
- AUC怎么算
- 随机森林算法的原理,为什么优越;样本是有放回还是无放回;特征值是有放回还是无放回
- 为什么随机森林的样本是有放回抽样(可以减小方差,类似于bootstrap)
- ROC和AUC值的原理 <