一、机器学习入门
1.机器学习基本概念
•监督学习、非监督学习、半监督学习和强化学习是机器学习中的主要学习类型,它们在解决不同类型的问题时具有不同的方法和应用场景:
-
监督学习(Supervised Learning):
- 监督学习是指从有标签的训练数据中学习预测模型的过程,即每个样本都有对应的输入特征和标签(或输出)。
- 监督学习的目标是根据输入特征预测出正确的输出标签,比如分类和回归问题。
- 典型的监督学习算法包括决策树、支持向量机、神经网络等。
-
非监督学习(Unsupervised Learning):
- 非监督学习是指从无标签的训练数据中学习模型的过程,即训练数据只有输入特征没有对应的标签。
- 非监督学习的目标是发现数据中的隐藏结构、模式或关系,通常是通过聚类、降维、关联规则挖掘等方法实现的。
- 典型的非监督学习算法包括 K 均值聚类、主成分分析(PCA)、关联规则挖掘等。
-
半监督学习(Semi-Supervised Learning):
- 半监督学习是指同时利用有标签数据和无标签数据来进行学习的一种方法,通常有大量的无标签数据和少量的标签数据。
- 半监督学习的目标是通过结合有标签数据的监督信号和无标签数据的信息来提高模型的性能和泛化能力。
- 半监督学习算法可以是监督学习和非监督学习的结合,例如在监督学习模型中引入无标签数据作为正则项,或者使用半监督聚类等方法。<