机器学习简介

想打球的码农

已于 2024-07-24 22:37:23 修改

阅读量301

点赞数 3

分类专栏： AI从零入门文章标签：机器学习人工智能

于 2024-06-23 20:22:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45383658/article/details/139905246

版权

AI从零入门专栏收录该内容

4 篇文章 2 订阅

订阅专栏

一、有监督学习

核心目标：建立一个模型（函数），来描述输入（X）和输出（Y）之间的映射关系

价值：对于新的输入，通过模型给出预测的输出

1.有监督学习要点

(1)需要有一定数量的训练样本

(2)输入和输出之间有关联关系

(3)输入和输出可以数值化表示

(4)任务需要有预测价值

2.有监督学习在人工智能中的应用

(1)文本分类任务

输入：文本

输出：类别

关系：文本的内容决定了文本的类别

(2)机器翻译任务

输入：A语种文本

输出：B语种文本

关系：A语种表达的意思，在B语种中有对应的方式

(3)图像识别任务

输入：图像

输出：类别

关系：图中的像素排列，决定了图像的的内容

(4)语音识别任务

输入：音频

输出：文本

关系：声音信号在特定语言中对应特定的文本

二、无监督学习

给予机器的数据没有标注信息，通过算法对数据进行一定的自动分析处理，得到一些结论

常见任务：聚类、降维、找特征值等等

聚类

降维

三、一般流程

常用概念

(1)训练集:用于模型训练的训练数据集合

(2)验证集:对于每种任务一般都有多种算法可以选择，一般会使用验证集验证用于对比不同算法的效果差异

(3)测试集:最终用于评判算法模型效果的数据集合

(4)K折交叉验证:（K fold cross validation）:初始采样分割成K个子样本，一个单独的子样本被保留作为验证模型的数据，其他K-1个样本用来训练。交叉验证重复K次，每个子样本验证一次，平均K次的结果

(5)过拟合:模型失去了泛化能力。如果模型在训练集和验证集上都有很好的表现，但在测试集上表现很差，一般认为是发生了过拟合

(6)欠拟合:模型没能建立起合理的输入输出之间的映射。当输入训练集中的样本时，预测结果与标注结果依然相差很大

(7)评价指标:为了评价算法效果的好坏，需要找到一种评价模型效果的计算指标。不同的任务会使用不同的评价指标。常用的评价指标有：

1）准确率

2）召回率

3）F1值

4）TopK

5）BLEU…

想打球的码农

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

想打球的码农 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。