机器学习几大类
1、监督学习(Supervised Learning):
在有标号的数据上训练一个模型,任务是对标号的预测(例子:在房屋预测的例子中对房子价格的预测。或者预测图片的类别)
有一个大家比较关注的模型是自监督学习算法(Self_Supervised_Learning ),是一种可监督的学习,会产生一些标号,但是这些标号来自数据的本身(例子:字嵌入,BERT)
2、半监督学习(Semi-Supervised Learning):
在有标号和没有标号的数据上进行模型的训练,模型的任务一:学习的模型来预测标号(尽量的使用那些没有标注好的信息),任务二:就是使用模型把那些没有标号的数据进行标号(例子:自训练)
3、无监督学习(Unsupervised):
数据没有标号,任务也不是预测数据的标号【聚类算法、估计分布(GAN)】(GAN:生成对抗模型)也是这样的一个类型
4、强化学习(Reinforcement)
模型跟环境进行交互,从环境中获取观测点后再进行学习,再做一些重新获取的反馈(更像是人类的学习的方式)
强化学习是很难的一部分,讨论的较多的还是监督学习和无监督学习
监督学习模型训练中比较重要的东西
1、模型(Model):通过输入预测输出;
2、损失函数(Loss):用于衡量模型预测的值和真是值之间的差别
3、目标(Object):在模型训练中,优化函数
4、优化(Optimization):在模型中没有指定的参数(刻意学习的参数)再实际数据中填上值,使的我们的目标函数最小化损失;
监督学习的分类:
1、决策树(Decision Tree):用树来做决定;
2、线性模型(Linear methods):做决策的时候是根据这个输入的线性的组合;
3、核方法(Kernel machines):用核函数来衡量两个样本之间的相似度。
4、神经网络(Neural Networks):用多层的神经网络来学习一个特征的表示,使得在之后接的一个线性方法里会有一个很好的表示。
总结:
视频学习链接:https://www.bilibili.com/video/BV1Nv411u7bW?spm_id_from=333.999.0.0添加链接描述