机器学习入门术语

最新推荐文章于 2022-01-03 20:34:27 发布

yangtom249

最新推荐文章于 2022-01-03 20:34:27 发布

阅读量198

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_44153121/article/details/113806677

版权

机器学习专栏收录该内容

23 篇文章 0 订阅

订阅专栏

本文内容整理自周志华机器学习，机器学习研究的主要内容：在计算机中从数据中产生“模型 model”的算法，即“学习算法 learning algorithm”。
Tom Mitchell关于机器学习的定义：假设用性能度量 P 来评估计算机程序在某类任务的性能，若一个程序通过利用经验 E 在任务 T 中改善其性能，我们就说关于性能度量 P 和任务 T，程序对经验 E 进行了学习。
Tom Mitchell原话：

A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P if its performance at tasks in T, as measured by P, improves with experience E

拗口的定义，自我理解：计算机程序在对经验 E的学习过程中，提高了任务 T 的性能度量指标P。
机器学习所研究的主要内容，是关于在计算机上从数据中产生“模型”（model）的算法，即学习算法（learning algorithm）。

入门术语

示例 (instance) 或样本 (sample)：关于一个事件或对象的描述（数据记录）
数据集 (data set)：一组记录的集合
属性 (attribute) 或特征 (feature)：反映事件或对象在某方面的表现或性质的事项
假设 (hypothesis)：学习模型对应了关于数据某种潜在的规律
标签 (标记、label)：示例结果的信息
样例 (example)：拥有标记信息的示例

学习任务分类:
根据训练数据是否拥有标记信息，学习任务分为两大类：监督学习（supervised learning）和无监督学习(unsupervised learning)。
在监督学习中，数据包含输出变量或标记，主要任务是分类和回归。
分类 (classification)：预测结果是离散值的学习任务
回归 (regression)：预测结果是连续值的学习任务
在无监督学习中，数据不包含输出变量或标记，而其主要任务是发掘模式。
聚类 (clustering)：将物理或抽象对象的集合分成由类似的对象组成的多个类的过程

大数据时代三大关键技术：机器学习、云计算、众包（crowdsourcing）

yangtom249

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习入门术语

本文内容整理自周志华机器学习，机器学习研究的主要内容：在计算机中从数据中产生“模型 model”的算法，即“学习算法 learning algorithm”。A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P if its performance at tasks in T, as measured by P
复制链接

扫一扫