一天了解一个机器学习模型——机器学习基础知识

star_and_sun

于 2024-05-25 19:46:14 发布

阅读量412

点赞数 6

文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/star_and_sun/article/details/139201586

版权

人工智能的两大任务——预测和决策

预测包括对输入目标的模式识别、标签分类、回归、预测未来数据、聚类
决策需要机器产生行动，改变状态，如下围棋、自动驾驶

支持人工智能的四大类技术

搜索——结合算法探索分支的好坏，从而做出决策，如下棋
推理——基于给定的知识归纳出规律完成证明、知识问答
学习——通过经验数据对目标优化的自动化过程，如人脸识别
博弈——多个人工智能体的交互，如足球配合
可以这样子说“学习是系统基于数据来提升既定指标分数的过程”

机器学习的三大类——监督学习、无监督学习、强化学习

监督学习：数据实例有（x，y）即特征x和标签y，根据特征来预测标签，由损失函数来定义性能指标。如人脸识别，关注这个人脸图像是否准确预测对应的身份
无监督学习：没有标签y了，主要关注数据的分布，包含的模式。如关注人脸图像的分布，判断这个图像是否包含人脸
强化学习：关注人工智能的决策问题，寻找更好的决策过程

机器学习模型的泛化能力是什么呢？

泛化能力：描述一个只能模型在没有见过的数据上的预测能力，用泛化误差来衡量模型的泛化能力，也就是说机器学习模型见过很多数据，对于新的数据也可以预测，就是因为经验丰富，见过很多数据的底气！这个叫做统计泛化能力

机器学习的模型天赋

也就是说面对不同的任务需要选择较为准确的模型来做，怎么选择模型呢，就要看机器学习模型的特点，也叫归纳偏置，字面大概意思就是说他们的归纳的一个偏好。也就是是模型对问题的假设是这样子的，如果你的数据也是这样子，那这个模型很适合。
ps：如果归纳偏置更强的模型可以更好的发现数据的模式。
神经网络对同分布领域的数据归纳偏置高，所以在处理图像和语音很适合，但是树模型对混合离散的数据偏置高，就很适合做风险预测什么的。