机器学习基础知识整理归纳

本文对机器学习的基本概念进行了深入的整理,包括前言、基本术语、假设空间和归纳偏好。介绍了机器学习的定义,强调了模型和学习过程的重要性。讨论了数据集、示例、属性、假设、分类与回归等核心概念,并探讨了监督学习与无监督学习的区别。此外,还阐述了假设空间和版本空间的概念,以及归纳偏好的作用,指出奥卡姆剃刀原则在模型选择中的指导意义。
摘要由CSDN通过智能技术生成

关于机器学习的一些基本概念的整理

1.前言

1.机器学习是一门致力于研究如何通过计算的手段,利用经验来改善系统自身的性能的学科。1997年Mitchell给出一个更形式化的定义,假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习。

  1. 机器学习所研究的主要内容,是关于在计算机上从数据中产生“模型”的算法,即学习算法(learning algorithm)。“数据”即是现实生活中的“经验”。
  2. 关于产生的模型(model),可以泛指从数据中学得的结果。但也有不同说法。Hand在2001年发表的一篇文献中就提到,模型是全局结果(例如一颗决策树),模式指的是局部性结果(例如一条规则)。

2. 基本术语

引例,假设搜集到一些关于西瓜的数据(色泽 = 青绿;根蒂 = 蜷缩;敲声 = 浊响),(色泽 = 乌黑;根蒂 = 稍蜷;敲声 = 沉闷),(色泽 = 浅白;根蒂 = 硬挺;敲声 = 清脆),......

上述引例中,每对括号内是关于西瓜的(也可是任何一个事件或者对象的)一条记录,则有:

数据集 (data set): 一组记录的集合

示例/样本(instance/sample):上述都每一条记录,均可称为示例/样

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值