民大机器学习复习资料、计算机网络复习资料、操作系统复习资料、数据库复习资料、自然语言处理整理资料、强化学习整理资料打包分享，也可以单独分享。

土豆打工仔

已于 2024-01-15 14:41:13 修改

阅读量468

点赞数 14

文章标签： emacs 模拟退火算法 memcached ruby on rails 深度学习神经网络自然语言处理

于 2024-01-11 18:07:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51278988/article/details/135536058

版权

本文详细介绍了机器学习的基本概念，如泛化能力、分类与回归、监督与无监督学习的区别，以及评估模型的过拟合与欠拟合问题。讲解了评估方法、性能度量和常见算法如线性回归、决策树、神经网络和SVM。

摘要由CSDN通过智能技术生成

名词解释 5题每题2分

选择题 15题每题2分

简述题 2题每题5分

计算题 5题 40分

编程题 10分

机器学习是什么？

让机器从数据中寻找或者总结出一个模型。

泛化能力：学得的模型适用于新样本的能力

分类：输出结果是离散值

回归：输出结果是连续值

监督学习：训练样本有标记

无监督学习：训练样本无标记

半监督学习：训练样本部分标记

假设空间：监督学习的任务是学习一个模型，是模型能够对任意给定的输入做出好的预测。模型属于由输入空间到输出空间的映射集合，这个几个就是假设空间。

版本空间：与训练集一直的假设集合

没有免费午餐定理：无论A算法多么聪明，B算法多笨拙，但是他们的期望性能相同。

评估一个模型的好坏更主要看泛化误差

习题：

学习器学习能力太强大，可能导致过拟合

一般通过增加训练轮数或增加模型复杂度等方式可以改善欠拟合

过拟合相对欠拟合更难解决

如果样本是小样本数据，更适合自助法。

误差：模型输出与样本真实值之间的差异

过拟合：用力过猛，学习能力过于强大，把不太一般的特征都学习到了。

欠拟合：用力不足，学习能力低下。

评估方法

目标：对于模型/学习器的泛化误差进行评估

专家样本：训练集 + 测试集

训练集：训练误差

测试集：测试误差(近似泛化误差)

要求：测试集数据独立同分布并与训练集互斥

留出法：

k折交叉验证法：将专家样本等份划分为k个数据集，轮流用k-1个用于训练，一个用于测试

自助法：随机有放回的取m个数据构成数据集D’，用D中不包含D‘的样本作为测试集。缺点为：改变了初始数据集的分布适用于小样本数据集

性能度量：

TP：真正例算法预测它为好瓜这个西瓜实际情况也是好瓜

FP：假正例算法预测它是好西瓜但是这个真实情况为怀西瓜

FN：假反例算法预测为换西瓜但这个西瓜真实是好西瓜

TN：真反例算法预测为好西瓜，真实情况为坏西瓜

查准率和查全率是一对矛盾的指标，一般说，当查准率高的时候，查全率一般很低，查全率高时，查准率一般很低。

P-R曲线

完全包住另一曲线，性能更优，比如A比C优。

ROC和AUC

泛化错误率和构成：偏差 + 方差 + 噪声

偏差(bias)：模型输出与真实值的偏离程度，刻画了算法的拟合能力。

方差：同样大小的训练集的变动导致学习性能的变化。

噪声：当前学习器所能达到的泛化误差的下限。

偏差大：欠拟合方差大：过拟合

如何找最小误差：最小二乘法？

均方误差最小化，找到一条直线，使所有样本到直线上的欧式距离之和最小

线性回归

一般流程总结

一般线性回归模型的损失函数曲线不存在局部最优点。

假设函数F(x) = wx ，在梯度下降过程中，如果w0处的导数为负，w的值会变大。

关于学习率：

1 学习率过大，损失值会变大

2 学习率过小，损失值会变小，只是速度慢

3 学习率较大，有可能没有办法找到最小损失

多元线程回归的一般步骤

决策树

决策树可以用于分类和回归

对某一时间发生概率小，信息量大

样本集合信息熵越大，纯度越小

决策树由一个根节点、多个中间节点、多个叶子节点构成

决策树的节点属性可以采用信息增益、信息增益率、基尼系数来确定

决策树算法包括：ID3、ID4、C4.5、CART

剪枝的作用：处理过拟合

决策树是一种非参数的监督学习方法，它能够从一系列有特征的标签的数据总结出决策规则，并用树状图的结构来呈现这些规则，来解决分类和回归问题。

信息熵越小，D的纯度就越高

ID3算法

基尼指数越大，样本的不确定性就越大。

剪枝处理

神经网络

感知机不能解决线性不可分

神经网络的监督学习方法的一般思路：

1 初始化权重 2 获取输入送入模型并获得输出，依据正确输出计算误差

3 BP算法调整权重 4 重复2 3 步

SVM

SVM可以解决二分类、多分类、回归问题。

找到最优线的三个条件 1 该直线分开了两类 2 该直线能够获得最大间隔 3 该直线处于间隔的中间，到所有支持向量的距离相等。

支持向量机需要找到最大间隔的超平面

需要最大化d，等于最小化w。

只要一个对称函数对应的和矩阵半正定，就可以作为核函数。

朴素贝叶斯

概率模型训练的过程就是参数估计的过程

极大似然估计：估计出的参数使得已知样本出现的概率最大，即是使得训练数据的似然最大。

朴素：特征数据相互独立

拉普拉斯修正：为了便面其他属性携带了信息被训练集未出现的属性值抹去，在估计概率值通常进行平滑。

以上的内容，需要可以联系。

土豆打工仔

关注

14
点赞
踩
10

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。