机器学习笔记——机器学习建议与误差分析

最新推荐文章于 2024-11-20 11:00:00 发布

Veropatrinica

最新推荐文章于 2024-11-20 11:00:00 发布

阅读量677

点赞数

分类专栏：机器学习文章标签：机器学习神经网络不对称分类验证集学习曲线

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shanwenkang/article/details/85044680

版权

机器学习专栏收录该内容

12 篇文章

订阅专栏

建议

在实践过程中我们经常会发现我们的建模不合适，那么这种情况我们应该对我们模型的参数进行调整呢

评估假设

我们首先要做的就是对我们建立的模型进行评估，来判断模型拟合是否合适。我们将利用训练集求出来的网路参数θ应用在测试集上得到的误差叫做测试集误差，这个误差越小代表建模越合适

验证集

为了选择一个合适的模型，我们需要尝试多种多项式来保证我们既不会过拟合也不会欠拟合。方法就是求出各种假设函数的测试集误差来选择最小误差对应的假设函数

但是这种用根据测试集误差选出来的假设函数很可能是对一般误差的一种乐观估计，因此我们还需要一个不想关的测试集来对这个假设函数进行函数。为此我们将数据分为训练集、验证集、测试集三个部分。选择参数的过程我们在验证集上做

偏差与方差

我们对欠拟合与过拟合又有另一个名字：高偏差与高方差

我们可以看出当假设函数由低次到高次渐变的过程中测试集误差与训练集误差的变化情况。也正是从这个曲线中我们可以判断我们的假设函数是过拟合还是欠拟合了。高偏差对应的是测试集误差与训练集误差都高，高方差对应的是测试集误差高，训练集误差低

正则化

我们之前讲到过正则化，正则化前面的系数也跟过拟合/欠拟合有关，正则化系数越大，代表着欠拟合越严重；系数越小代表过拟合严重

同样我们可以像选择假设函数多项式最高次幂的方法一样不断调整正则化系数λ来取得最合适的拟合效果

同样我们也可以根据训练集误差和测试集误差来判断λ是过大还是过小

学习曲线

除了上述方法，我们还可以通过学习曲线来判断拟合效果

对于高偏差来说，随着训练集数量增加，测试集误差与训练集误差将靠的很近，因为多项式的次幂限制了曲线继续演进，从而使测试集误差与训练集误差都维持在一个较高的值

对于高方差曲线来说，训练集误差维持在一个较低的值，测试集误差维持在较高的值，但是随着训练集增加，这个间隔会越来越小

下一步

在有了之前的铺垫以后我们就可以很好的决定下一步做什么了，我们可以根据曲线是过拟合还是欠拟合来进行选择下一步尝试方法

大数据原理

我们经常听到说“It's not who has the best algorithm that wins, its who has the most data.”那我们应该如何构建一个高精度的系统呢，保证大数据能够应用在好的算法上呢？首先我们得保证我们已经获得一组数据中足够多的特征，判断标准就是人类是否能根据这些特征做出判断

足够多的特征保证了我们不会欠拟合，也就意味着训练集误差会比较低，之后我们通过增大数据量，来使测试集误差逼近训练集误差来保证我们的算法有很好的精度与普适性

误差分析

当我们要对一个很复杂的模型建模的时候我们往往是先用几天的时间建立一个很简单的模型来判断误差的大小，再通过画出学习曲线等方法来决定是否需要增加特征或是增加测试集数量等等

不对称分类

对于两种十分不对称的分类，我们采用传统的误差分析（即错误率）不能很好地验证算法的有效性。比如我们得到了一个错误概率为1%的算法，但是实际上只有0.5%的病人，那么我们只需要做出所有人都不得病的判断就能获得错误率为0.5%的算法，但是这显然是一种不合理的算法。这也就意味着我们需要一个新的评判标准

我们可以用精准率与召回率这两个参数来进行度量。精准率代表判断为病人的人中真正得病的人的比例；召回率代表实际得病的人中被诊断出有病的人的比例

我们可以通过调整假设函数的阈值来调整这两者的值，很多时候我们需要在这二者中做出一个权衡

有两个度量标准很多时候让我们不知道如何选择，为了解决这个问题，我们有F分的方法将二者融合为一个标准

博客等级

码龄7年

93
原创

288
点赞

1156
收藏

2235
粉丝

关注

私信

热门文章

分类专栏

笔记 1篇
三维重建 1篇
图神经网络 1篇
Unity3D 8篇
Reading Notes 4篇
OJ 32篇
VR 5篇
CUDA 6篇
图像处理 12篇
机器学习 12篇
CNN 14篇
环境配置 2篇
杂 3篇

最新评论

数字图像处理笔记——阈值（Thresholding）
byte_ee: 大佬有代码吗，能再出一篇有代码的版本吗
快速理解图神经网络（GCN）
嵩哥迷弟: Out[6]还差一行[2, -2]没写出来
数字图像处理笔记——酉变换（ Unitary image transforms）
Орехов: DFT变换的系数矩阵A应该是正交矩阵，而不是酉矩阵吧，验证代码如下 [code=plain] H = 10; [k, n] = meshgrid(0:H-1); A = exp(-1i*2*pi*u.*x/H); % DFT变换的系数矩阵A E = A * A'; % A*A'的结果是对角矩阵，说明A是正交矩阵 not_E = A * conj(A'); % A*conj(A')的结果不是对角矩阵，说明A不是酉矩阵 [/code]
简单实例理解Unity世界坐标和局部坐标下四元数旋转（四元数乘法）
云上空: 四元数乘法旋转的本质是旋转的连续应用。当你执行p * q时，可以理解为首先应用四元数p的旋转，然后再应用四元数q的旋转。因此transform.rotation=transform.roation*quaterion可以解析如下: transform.rotation表示应用自身的旋转（也可以理解为将物体从默认旋转应用到transform.rotation），然后应用Quaternion旋转（也可以说是向自己施加quaterion旋转，一个意思），因此结果就是绕本地轴旋转了quaternion. 而transform.rotation=Quaternion*transform.rotation; 可以理解为对空间应用Quaternion旋转，对空间进行旋转也就是对空间坐标系的基进行旋转。也就是将整个空间朝某个方向旋转，然后在旋转后的空间中再应用transform.rotaion，因此就是绕世界轴进行了旋转。作为子物体时的四元数旋转：物体的localRotation其实就等于先应用父物体旋转，再应用本地旋转，也就是：transform.rotation = transform.parent.transform.rotation * transform.localRotation。但是我这里不打算通过这个来推断之后的局部旋转和全局旋转的异同关系。因为局部旋转的计算本质上依然是旋转的连续应用。局部坐标时,localRotation=loaclRotation*q和世界坐标的原理一样，也是先应用自身旋转然后应用q的旋转。结果便是绕自身坐标系旋转。而使用transform.localRotation=q*transform.localRotation也和之前一样。还是先对坐标系进行旋转，只不过这里旋转的是局部坐标系，然后再应用自身旋转，也就是自身绕着局部坐标系中的q进行了旋转。和世界坐标中的旋转原理一样，但是坐标系不同，结果自然不同。
Unity开发——Hololens2+Vuforia实现图像识别详细教程
Yxyrwx: 我运行之后不会出现在hololens中不会vuforia菜单，并且模型只会显示在一个浏览框里，不像官方给的例子那种可以在任意角度都能识别出来，这应该咋解决

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。