机器学习（周志华） --绪论

最新推荐文章于 2024-11-08 13:47:26 发布

2201_75585176

最新推荐文章于 2024-11-08 13:47:26 发布

阅读量407

点赞数 3

分类专栏：机器学习文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/2201_75585176/article/details/135929837

版权

1 篇文章 0 订阅

订阅专栏

本文介绍了机器学习的基本概念，包括机器学习的目标（通过数据生成模型），关键术语如数据、样本、特征、训练等，以及归纳偏好和理论基础如奥卡姆剃刀和NFL定理。它概述了《机器学习》一书中绪论部分的内容，为初学者提供了基础知识。

摘要由CSDN通过智能技术生成

前言

就周志华所著《机器学习》来学习“机器学习”。

绪论篇

机器学习主要研究如何通过数据来产生**”模型“（利用经验判断未知**）。

假定我们收集了一批关于西瓜的数据，例如(色泽=青绿; 根蒂=蝽缩; 敲声=浊响)，(色泽=乌黑; 根蒂=稍蟋; 敲声=沉闷)，(色泽=浅白; 根蒂=硬挺;敲声=清脆)，…，每对括号内是一条记录， “ = ” 意思是 “ 取值为”。

样本（sample）/示例/特征向量：一个事件或一个对象的描述（此处为一条记录）
特征（feature）/属性：反映事件或对对象在某方面的表现或性质的事项（例如“色泽”）
属性值：属性的取值（例如“青绿”）
数据集：记录的集合
属性空间：属性张成的空间

例如我们把“色泽” “根蒂” “敲声作为三个坐标轴，则它们张成一个用于描述西瓜的三维空间，每个西瓜都可在这个空间中找到自己的坐标位置

学习/训练：从数据中学得模型
训练数据：训练过程中使用的数据
训练样本：训练过程中使用的样本
训练集：训练样本组成的集合
假设：学得模型对应了关于数据的某种潜在规律
真相/真实：潜在规律自身

要建立这样的关于“预测” (prediction)的模型，我们需获得训练样本的“结果”信息例如 “ (( 色泽 = 青绿 ; 根蒂 = 蜷缩 ;敲声 = 浊响)好瓜)”.这里关于示例结果的信息，例如“好瓜”，称为“标记”(label ); 拥有了标记信息的示例，则称为“样例” (example)。一般地，用(xi，yi)表示第之个样例，其中yi属于y是示例xi的标记，y是所有标记的集合，亦称“标记空间”。

学习任务分类