周志华机器学习笔记

b站上听周志华亲授课

B站课程链接

第1、2讲:

1.简介

机器学习属于人工智能的一种

机器学习主要是研究如何使计算机从给定的数据中学习规律,即从观测数据(样本) 中寻找规律,并利用学习到的规律(模型) 对未知或无法观测的数据进行预测,其中数据表示规律

简单来说,机器学习是从过往的经验中去总结出通用的规律,进而预测未来

机器学习不是100%准确的,但是准确率高,就像晚霞好但是第二天 仍然可能下雨。

因素越多,越难预测准确。

2.模型评估方法

机器学习中的问题分为4类:分类,回归,聚类,关联

分类有2分类和多分类,一般所关注的为正类

回归:预测值为连续的

聚类:把大量的特征分为不同组

算法和数据通过学习机最终生成模型

一个例子:预测贷款额度。数据+学习模型形成模型

机器学习分为监督学习和无监督学习,监督学习包含标签

监督学习(supervised learning): 数据附带了要预测的附加属性。从已有数据中发现关系:由多个输入映射一个输出。并用数学模型表示,将新数据用这数学模型运算得到新的输出。

无监督学习(unsupervised learning):将已有数据进行分类只有输入,没有输出,将输入的数据按照学习到的标准进行分类。

机器学习的应用有:数据挖掘,计算机视觉,自然语言处理,统计学习,数据挖掘,模式识别

机器学习流程:数据收集与处理,特征选择与模型建立,评估与预测

评估模型的方法:

留出法

将数据集D划分为两个互斥的集合,一个作为训练集S,一个作为测试集T, 常见的划分为:大约2/3-4/5的样本用作训练,剩下的用作测试

需要注意的是:训练/测试集的划分要尽可能保持数据分布的一致性,以避免由于分布的差异引入额外的偏差,常见的做法是采取分层抽样

交叉验证可以多次进行,如10次十折

样本少时可以采用自助法

1.简介

机器学习属于人工智能的一种

机器学习主要是研究如何使计算机从给定的数据中学习规律,即从观测数据(样本) 中寻找规律,并利用学习到的规律(模型) 对未知或无法观测的数据进行预测,其中数据表示规律

简单来说,机器学习是从过往的经验中去总结出通用的规律,进而预测未来

机器学习不是100%准确的,但是准确率高,就像晚霞好但是第二天 仍然可能下雨。

因素越多,越难预测准确。

2.模型评估方法

机器学习中的问题分为4类:分类,回归,聚类,关联

分类有2分类和多分类,一般所关注的为正类

回归:预测值为连续的

聚类:把大量的特征分为不同组

算法和数据通过学习机最终生成模型

一个例子:预测贷款额度。数据+学习模型形成模型

机器学习分为监督学习和无监督学习,监督学习包含标签

监督学习(supervised learning): 数据附带了要预测的附加属性。从已有数据中发现关系:由多个输入映射一个输出。并用数学模型表示,将新数据用这数学模型运算得到新的输出。

无监督学习(unsupervised learning):将已有数据进行分类只有输入,没有输出,将输入的数据按照学习到的标准进行分类。

机器学习的应用有:数据挖掘,计算机视觉,自然语言处理,统计学习,数据挖掘,模式识别

机器学习流程:数据收集与处理,特征选择与模型建立,评估与预测

评估模型的方法:

留出法

将数据集D划分为两个互斥的集合,一个作为训练集S,一个作为测试集T, 常见的划分为:大约2/3-4/5的样本用作训练,剩下的用作测试

需要注意的是:训练/测试集的划分要尽可能保持数据分布的一致性,以避免由于分布的差异引入额外的偏差,常见的做法是采取分层抽样

交叉验证可以多次进行,如10次十折

样本少时可以采用自助法

-------------------------------------------以上内容更新于  2023 .7.17----------------------------------------------

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值