人工智能学习之路——基本术语

最新推荐文章于 2024-07-31 19:40:30 发布

置顶且听@风吟

最新推荐文章于 2024-07-31 19:40:30 发布

阅读量420

点赞数 1

分类专栏：人工智能文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tctxh123/article/details/106540489

版权

人工智能专栏收录该内容

2 篇文章 0 订阅

订阅专栏

基本术语

数据集：一组记录的集合
记录：关于一个事件或对象的描述，又称“示例/样本”
如关于一个西瓜的记录：（色泽=浅白；根蒂=硬挺；敲声=清脆）多个西瓜的记录又可以构成一组西瓜的数据集
属性：反映事件或对象在某方面的表现或性质的事项
如"色泽"，“敲声”
属性空间：属性张成的空间
如把“色泽”“根蒂”“敲声”作为三个坐标轴，则张成一个用于描述西瓜的三维空间用于表述西瓜的三维空间，每个西瓜都有对应的坐标，空间中每一个点对应一个坐标向量，一个示例也称为“特征向量”
学习/训练：从数据中学得模型的过程
训练数据：训练过程中使用的数据
训练样本：其中每一个样本称为“训练样本”
训练集：训练样本组成的集合
假设：指学得的模型，对应于关于数据的某种潜在的规律
真相/真实：潜在规律的本身
学习过程：就是为了找出真相或逼近真相
标记（lable）：关于示例的结果，如“好瓜”
（（色泽=浅白；根蒂=硬挺；敲声=清脆），好瓜）
一般地：

若欲预测的是离散值，“好瓜”“坏瓜”；此类学习任务称为“分类（classification）”；只涉及到两个类别，称为“二分类（binary classification）”
若欲预测的是连续值，西瓜的成熟度0.94,0.37；此类学习任务称为“回归（regression）”
还可以对西瓜进行“聚类”（clustering）将训练集中的西瓜分为若干组，每组称为一个“簇”（cluster），如浅色瓜，深色瓜
根据训练数据是否拥有标记信息，学习任务可分为：“监督学习”（supervised learning），“无监督学习”（unsupervised learning）
“分类”，“回归”是“监督学习”代表，“聚类”是“无监督学习”代表

测试（testing）：学得模型后，使用模型进行预测的过程
测试样本（testing sample）：被测试的样本

f：模型； y：标记（lable）；x：测试例
泛化：学得的模型适应新样本的能力

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。