机器学习简介

一、有监督学习

核心目标:建立一个模型(函数),来描述输入(X)和输出(Y)之间的映射关系

价值:对于新的输入,通过模型给出预测的输出

1.有监督学习要点

(1)需要有一定数量的训练样本

(2)输入和输出之间有关联关系

(3)输入和输出可以数值化表示

(4)任务需要有预测价值

2.有监督学习在人工智能中的应用

(1)文本分类任务

输入:文本

输出:类别

关系:文本的内容决定了文本的类别

(2)机器翻译任务

输入:A语种文本

输出:B语种文本

关系:A语种表达的意思,在B语种中有对应的方式

(3)图像识别任务

输入:图像

输出:类别

关系:图中的像素排列,决定了图像的的内容

(4)语音识别任务

输入:音频

输出:文本

关系:声音信号在特定语言中对应特定的文本

二、无监督学习

给予机器的数据没有标注信息,通过算法对数据进行一定的自动分析处理,得到一些结论

常见任务: 聚类、降维、找特征值等等

聚类

降维

三、一般流程

常用概念

(1)训练集:用于模型训练的训练数据集合

(2)验证集:对于每种任务一般都有多种算法可以选择,一般会使用验证集验证用于对比不同算法的效果差异

(3)测试集:最终用于评判算法模型效果的数据集合

(4)K折交叉验证:(K fold cross validation):初始采样分割成K个子样本,一个单独的子样本被保留作为验证模型的数据,其他K-1个样本用来训练。交叉验证重复K次,每个子样本验证一次,平均K次的结果

(5)过拟合:模型失去了泛化能力。如果模型在训练集和验证集上都有很好的表现,但在测试集上表现很差,一般认为是发生了过拟合

(6)欠拟合:模型没能建立起合理的输入输出之间的映射。当输入训练集中的样本时,预测结果与标注结果依然相差很大

(7)评价指标:为了评价算法效果的好坏,需要找到一种评价模型效果的计算指标。不同的任务会使用不同的评价指标。常用的评价指标有:

1)准确率

2)召回率

3)F1值

4)TopK

5)BLEU…

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

想打球的码农

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值