面试准备
翔燕
这个作者很懒,什么都没留下…
展开
-
面试之特征工程---(1)
文章来源于《百面机器学习》 1.为什么需要对数值类的特征做归一化处理? 回答此问题要从特征归一化是啥,常用的有哪些,有什么用,局限性来说,下面分别说明 啥是特征归一化?-----就是将特征统一到一个大致相同的区间类 常用的方法: 1)线性函数归一化 将训练集中数值特征通过线性变换,缩放到0-1的范围,具体方法是Xnorm=X−XminXmax−XminX_{norm}=\frac{X-X_{mi...原创 2019-09-20 10:17:42 · 356 阅读 · 0 评论 -
面试之降维---(2)
1.为什么要进行降维? 在机器学习中,数据通常需要被表示成向量形式以输入模型进行训练。对向维向量进行处理和分析时,会极大地消耗系统资源,甚至产生维度灾难。因此,进行降维,即用一个低维度的向量表示原始高维度的特征就显得尤为重要。 2.降维的方法有哪些? 常见的降维方法有主成分分析(PCA)、线性判别分析(LDA)、等距映射、局部线性嵌入、拉普拉斯特征映射、局部保留投影等。 (1)PCA PCA属于...原创 2019-09-20 17:18:38 · 403 阅读 · 0 评论 -
面试之模型评估---(3)
1、评价指标有哪些? 准确率(Accuracy):正确分类样本占样本总数的比值,对与偏科问题时候不适用 精确率(Precision):被正确预测出来的正类占预测正类的比值 召回率(Recall):被正确预测出来的正类占样本实际正类的比值 F1 Score :F1Score=2PRP+RF_1 Score = \frac{2PR}{P+R}F1Score=P+R2PR ROC曲线:横轴是假阳性...原创 2019-09-20 20:40:20 · 667 阅读 · 0 评论