周志华《机器学习》(西瓜书)入门学习笔记1

本文概述了机器学习的核心概念,包括利用经验改善系统的定义、典型的学习过程(训练模型和处理新数据)、计算学习理论中的PAC学习模型,以及基本术语如数据集、训练与测试、模型类型(监督与无监督)、泛化能力等。
摘要由CSDN通过智能技术生成

1. 经典定义

  • 机器学习的定义:利用经验改善系统自身的性能。
  • 经验在系统中以数据形式存在。目前主要研究智能数据分析的理论和方法。

2. 典型的机器学习过程

使用学习算法,用训练数据训练模型。再用模型处理新数据样本。

3. 计算学习理论

  1. 最重要的概率模型:PAC (Probably Approximately Correct ,概率近似正确) learning model
  2. P:多项式时间里能找到精确解 NP:多项式时间里能判断是不是解

4. 基本术语

关于训练数据:

  • 数据集训练;测试
  • 示例(isntance):无结果的;样例(example):有结果的
  • 样本(sample):有时指示例有时指样例
  • 属性(attribute);特征(feature);属性值
  • 属性空间;样本空间;输入空间
  • 特征向量
  • 标记空间,输出空间

关于模型:

  • 假设
  • 真相
  • 学习器
  • 分类,回归
  • 二分类,多分类
  • 正类,反类
  • 监督学习;无监督学习:拿到的数据里是否有结果
  • 未见样本(unseen instance)
  • 未知分布
  • 独立同分布(iid):未知分布和已知数据都独立,都在同一个分布上
  • 泛化(generalizaiton)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值