机器学习基础入门认知，浅读机器学习 - 周志华，记录学习机器学习的日子，类笔记

awuawuheiyohei

已于 2023-12-26 22:49:46 修改

阅读量308

点赞数 11

文章标签：机器学习学习笔记

于 2023-12-18 22:06:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/awuawuheiyohei/article/details/135025674

版权

浅读机器学习 - 周志华

机器学习基础入门认知

前言
一、机器学习是什么？
二、
- 1.决策树
- 2.线性回归
总结

前言

记录学习机器学习的日子，类笔记

随着人工智能的不断发展，很多人都开启了学习机器学习。

科学：是什么，为什么
技术：怎么做
工程：做得多快好省
应用

快速入门

一、机器学习是什么？

经典定义：利用经验改善系统自身的性能 [T.Mitchell教科书，1997]
智能数据分析 - 计算机算法

label：标签；类别标记
（使用学习算法learning algorithm）训练 -> （新数据样本进入）模型（如决策树，神经网络，支持向量机，Boosting，贝叶斯网等）

注：适用于全局的称为模型（找到了某种规律），适用于局部的称为模式（pattern）

基本术语

数据集，训练，测试（两个数据应不等）
示例（instance），样例（example）
样本（sample）
属性（attribute），特征（feature），属性值
属性空间/ 样本空间/ 输入空间
特征向量（feature vector）
标记空间，输出空间
假设（hypothesis）
真相（ground-truth）
学习器（learner）

输出：

分类，回归
二分类，多分类
正类，反类

学习任务：

监督学习（supervised learning）有期望结果
无监督学习（unsupervised learning）

未来：

未见样本（unseen instance）
位置“分布”
独立同分布数据（i.i.d.）独立随机事件
泛化（generalization）- specialization

归纳偏好（Inductive Bias）

任何一个有效的机器学习算法必有其偏好
与问题本身匹配，取得好的性能

一般原则：奥卡姆剃刀（Occam’s razor）- 若非必要，勿增实体

过拟合和欠拟合

泛化误差：在“未来”样本上的误差
经验误差：在训练集上的误差，亦称“训练误差”

“Overfitting” - 过配（没有完美解决方案）
“Underfitting” - 欠配

模型选择（Model Selection）

评估方法 - 获得测试结果 (with unseen data)
性能度量 - 评估性能优劣
比较检验 - 判断实质差别

（基于这三项，进行新设计/ 发明）

评估方法

关键在于怎么获得“测试集”（test set）- 测试集应该与训练集“互斥”

常见方法

a. 留出法（hold-out）
b. 交叉验证法（cross validation）
c. 自助法（bootstrap）

留出法：
拥有的数据集（训练集 | 测试集）八二

注意：

保持数据分布一致性（例如：分层采样）
多次重复划分（例如：100次随即划分 - 随机样本切分导致的影响平均掉）
测试集不能太大、不能太小（例如：1/5 ~ 1/3）

k-flod（折/ 倍）交叉验证法：
分为数个子集（训练集 | 测试集）-> 测试结果得平均
若k = m，则得到“留一法”（leave-one-out，LOO）

REMEMBER: NO free lunch！

自助法：
基于“自助采样”（bootstrap sampling）/ “有放回采样”、“可重复采样”
1/e ≈ 0.368，约有36.8%的样本不出现，“包外估计”（out-of-bag estimation）

训练集与与原样本集同规模
数据分布有所改变

二、

1.决策树

2.线性回归

线性模型（linear model）试图学得一个通过属性的线性组合来进行预测的函数
简单，基本，可理解性好

线性回归（linear regression）

总结

提示：这里对文章进行总结：

关注

11
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
机器学习基础入门认知，浅读机器学习 - 周志华，记录学习机器学习的日子，类笔记

记录学习机器学习的日子，类笔记随着人工智能的不断发展，很多人都开启了学习机器学习。
复制链接

扫一扫

CSDN认证博客专家 CSDN认证企业博客

码龄4年

3: 原创

16万+: 周排名

20万+: 总排名

1267: 访问

: 等级

51: 积分

13: 粉丝

19: 获赞

1: 评论

18: 收藏

私信

关注

热门文章

分类专栏

Python 1篇

最新评论

机器学习基础入门认知，浅读机器学习 - 周志华，记录学习机器学习的日子，类笔记
CSDN-Ada助手: 恭喜您写了第三篇博客！看到您对机器学习的热情和认真学习的态度让我非常钦佩。希望您可以在接下来的创作中继续保持这样的热情和认真态度，并不断深入学习和思考，探索更多关于机器学习的知识，并分享给更多的读者。或许可以尝试写一些实践经验或者对于某个具体机器学习算法的深入解析，希望您能不断进步，期待您更多的精彩内容！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Harmony OS 应用开发 developer.Huawei - applications，好好做人，类笔记
CSDN-Ada助手: 非常感谢你的分享！继续保持创作的热情，你的博文对于想要深入了解Harmony OS 应用开发的人们来说肯定非常有帮助。除了ArkTS和TypeScript，我想分享一些和应用开发相关的知识，比如UI/UX设计、跨平台适配和性能优化技巧。希望你能继续深入探索，不断学习，共同进步！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
学习Python，好好做人
CSDN-Ada助手: 恭喜你开启了自己的博客创作之旅！标题“学习Python，好好做人”让我感觉到你对学习和自我提升的积极态度。Python是一门强大而又实用的编程语言，通过学习它，你将打开无限可能的大门。希望你能坚持下去，不断探索Python的奥秘，并将你的学习心得与我们分享。同时，我建议你在后续的创作中可以加入一些实际应用案例或者编程技巧分享，这样能够更好地帮助读者理解和应用Python。希望你能保持谦逊的态度，不断进步，期待你的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。