机器学习基础回顾

最新推荐文章于 2019-10-07 20:24:45 发布

蒹葭杰克

最新推荐文章于 2019-10-07 20:24:45 发布

阅读量286

点赞数

分类专栏：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/feizxiang3/article/details/100549637

版权

本文回顾了机器学习的基础知识，包括机器学习的定义、分类（监督学习、无监督学习、强化学习）以及模型评估的重要概念，如过拟合、数据集划分和ROC曲线。讨论了模型的训练、泛化能力和正则化，以及如何通过损失函数、风险函数和正则化项选择最佳模型。此外，文章还介绍了准确率、召回率、F1分数和ROC曲线在评估模型性能中的作用。

摘要由CSDN通过智能技术生成

序言 ----为了巩固一下之前的知识，最近重温了下西瓜书和统计学习方法，所以顺带写篇博客。

一、什么是机器学习，即机器学习的定义。

我认为可以从广义和狭义上去说，

广义上说就是让机器具有类似人一样的学习能力，通过学习新知识来提高自己的能力，而非直接编程告诉机器每一步执行什么。

狭义上说，就是让计算机基于数据构建（概率统计）模型，并通过该模型对未知数据进行预测与分析的方法。

（西蒙曾对“学习”下过这么一个定义：如果一个系统能够通过执行某个过程改进它的性能，这就是学习）

总结性的话说，机器学习研究的是数据，识别或总结出数据中的规律，构建模型。而它目的是对未知数据做预测，可以通过训练能够提升预测的准确度

二、有了定义，那么机器学习又可以分为哪些类呢？

常见的分类有：监督学习、无监督学习、强化学习

监督学习是我们最为常见的情况，它又可以分为回归问题、分类问题和标注问题。

输入和输出都是连续的值则是回归问题。输出是离散值则为分类问题。

下图监督学习的过程图，首先基于训练数据学习一个模型，然后再用该模型对测试集做预测。

模型一般有两种表示方法，决策函数（输入X，得到结果Y），或者条件概率分布(已知X得到Y的概率)

那么模型又分为哪些类型呢？

根据决策函数是否是线性函数，可以分为线性模型和非线性模型。

感知机、线性回归、线性支持向量机、k近邻 k均值等都是线性模型

核函数支持向量机、决策树、神经网络都是非线性模型

根据生产方法的不同，又可以分为生产模型和判别模型

由数据学习联合概率分布P(X,Y)然后求出条件概率分布P(Y|X)作为预测模型，即生成模型。典型的生成模型有朴素贝叶斯、隐马尔科夫模型。

由数据直接学习决策函数或条件概率分布作为预测的模型，即判别模型。包括k邻近、感知机、决策树、逻辑回归、最大熵模型、支持向量机、条件随机场等。

我们已经知道，模型由决策函数或条件概率

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。