机器学习（一）综述

最新推荐文章于 2024-07-30 11:24:09 发布

VickyGu9

最新推荐文章于 2024-07-30 11:24:09 发布

阅读量986

点赞数

分类专栏：机器学习文章标签：机器学习交叉检验

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/VickyGu9/article/details/54612438

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文是机器学习的初步介绍，涵盖了机器学习的基本过程，包括算法选择、评估标准，重点讨论了交叉检验的重要性，特别是10-fold交叉验证的实施步骤，以确保模型的准确性和泛化能力。

摘要由CSDN通过智能技术生成

综述

刚硕士毕业了，趁着对所学知识还有记忆，赶快把之前笔记整理下，写成博客也方便整理。机器学习真是一门诡异的课程啊，感觉学了什么又感觉什么也没学=_=。

目录：

综述

主要内容：

机器学习分为：

监督学习：

分类
1.1 决策树
1.2 KNN
1.3 SVM
1.4 人工神经网络（非DNN）
回归
2.1 线性回归
2.2 非线性回归

无监督学习：

聚类
层次聚类

深度学习（既有监督也有无监督所以单独摘出来说）：

CNN
RNN

比较常用的机器学习的算法和结构就是如上面所示。

机器学习的基本过程

**

评估机器学习算法

**

准确性
速度
健壮性
可规模化
可解释性
只有从这五个方面去评估才能评价出机器学习算法的优劣。

交叉检验：

在拿到数据即数据集的时候，要把数据集，分成训练集和测试集。
一种最常用的方法是平分，或者是取10分之一的数据来作为测试集合。剩下的都是训练集。这样有一个弊端，是在数据量不是特别大的时候浪费数据。那用来作为测试用的数据基本算是浪费了。因为算法并没有学习到这些数据中蕴含的规律。而且评估结果还容易产生误差。但如果把测试集也用作训练，则会使算法过度拟合。所以一个常用的方法就诞生了k-fold。比较常用的是10-fold。

算法：10-fold
1. 把数据分成10份
2. 取出其中一份为test set
3. 其他的9份都是training set
4. 用training set, training 算法
5. 用test set 测试出其中的准确率，或者 R方什么的来评估,得到结果 xi
6. 再从10份中选取从来没又作为Test set的一份来作为test set.
7. 重复2-6的过程，直到每份都作为test set 使用过。
8. 把10个评估结果取平均值。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。