机器学习包括哪几类方法及哪些任务?
主要有三类不同的学习方法:监督学习、非监督学习、半监督学习。
主要有四种常见的分类任务:二分类、多类别分类、多标签分类、不平衡分类。
请简述使用scikit-learn实现机器学习任务过程?
Scikit-Learn实现机器学习步骤:
- 通过从 Scikit-Learn 中导入适当的评估器类,选择模型类。
- 用合适的数值对模型类进行实例化,配置模型超参数(hyperparameter)。
- 整理数据,通过前面介绍的方法获取特征矩阵和目标数组。
- 调用模型实例的 fit() 方法对数据进行拟合。
- 对新数据应用模型:
-
在有监督学习模型中,通常使用 predict() 方法预测新数据的标签;
-
在无监督学习模型中,通常使用 transform() 或 predict() 方法转换或推断数据的性质。
简述在机器学习过程中为什么要采用独热编码(one-hot)?
因为大部分算法是基于向量空间中的度量来进行计算的,为了使非偏序关系的变量取值不具有偏序