看完了人工智能基础(高中生版)后,我们对人工智能和机器学习的理解有了简单的轮廓。现在可以从《白面机器学习》中学到更多基础和进阶的知识。
作者葫芦娃在引言里谈到:
想要成为一名优秀的算法工程师,更重要的是对算法模型有着发自心底的热忱,对研究工作有一种匠心精神。这种匠心精神,直白来讲,可以概括为:发现问题的眼光、解决问题的探索精神,以及对问题究原竟委的执着追求。
在翻过目录之后,映入眼帘的是问题索引。带着问题去理解书中内容,对机器学习的理解应该会有很大的提升!同时,有助于帮我们面试刷题哈哈哈
特征工程
-
为什么要对数值类型的特征做归一化?
为了消除特征之间的量纲影响。比如身高1.68m,体重50kg。归一化使得特征处于同一数量级,在学习速率相同的情况下,特征的更新速度变为一致,容易更快地通过梯度下降找到最优解。 -
怎样处理类别型特征?
类别型特征指的是离散的特征。除了决策树等少数模型可以直接处理字符串形式的输入,其他模型的类别特征必须转换为数值型特征才能工作。处理方法是:序号编码、独热编码、二进制编码等。 -
什么是组合特征?如何处理高纬度特征?
为了提高复杂关系的拟合能力,经常会把一阶离散特征两两组合,构成高阶组合特征。如果是ID类型的特征,组合特征维度会很高。一种行之有效的方法是将用户和物