我的人工智能之旅——假设函数模型的选择

最新推荐文章于 2022-11-05 15:47:02 发布

breakloop

最新推荐文章于 2022-11-05 15:47:02 发布

阅读量884

点赞数

分类专栏：人工智能机器学习人工智能之旅文章标签：假设函数过拟合欠拟合

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/daihuimaozideren/article/details/83022542

版权

人工智能同时被 3 个专栏收录

31 篇文章 0 订阅

订阅专栏

13 篇文章 0 订阅

订阅专栏

人工智能之旅

13 篇文章 4 订阅

订阅专栏

如何选择假设函数模型

通常假设函数的模型为 $f(x)=a_0x+a_1x^2+a_3x^4+...+a_nx^n$ ，其中n为最高次数，那么如何来确定n的取值呢？

通常的做法是，

（1）确定多个n值，例如 $n_0,n_1,n_2,...n_p$ ，形成多个假设函数 $f(x)_0,f(x)_1,f(x)_2,f(x)_p$

（2）将数据集分成三部分，训练集，交叉验证集，测试集，通常所占比例分别为60%，20%，20%。

（注意，测试集选定后，不再变动。）

（3）使用训练集对不同的假设函数模型进行训练，确定最优参数。

（注意，在训练过程中，需要假如正则化惩罚项，降低过拟合。因此这里需要一组 $\lambda$ ，例如取值为0.001，0.002，0.004，...，10，间隔2倍增长。通过训练，得出最优的 $\lambda$ ，以获取最优参数）

（4）使用交叉验证集检测步骤（3）所确定的多个假设函数准确率。

（5）更新训练集和交叉验证集。

（6）重复进行多次步骤（3）（4）（5）的循环操作。

（8）综合多个假设函数的准确率，选择准确率较好，较稳定的模型，从而确定n的值。

（9）使用测试集确定最终模型的准确率。

采用这种流程的目的，是为了保证假设函数的泛化，降低过拟合概率。

如何评判假设函数的准确率

通常使用学习曲线（learning curves）来衡量假设函数的准确度。

学习曲线公式为 $\frac{1}{2n}\sum _{i=1}^{n}{(f(x_i)-y_i)^2}$ 。

从数学角度来讲，实质是对均方误差（ $\frac{1}{n}\sum _{i=1}^{n}{(f(x_i)-y_i)^2}$ ）的使用。

如果训练集的均方误差高，肯定为欠拟合。需要提高假设函数最高次数。

如果训练集的均方误差低，交叉验证集的均方误差远高于训练集的均方误差，则为过拟合。需要降低假设函数最高次数。

通过学习曲线，也可帮助判断，当前的假设函数能否通过增加训练数据量的方式进行优化。如图

x轴为训练集数据量，y轴误差率。

在训练数据量小的情况下，假设函数容易拟合所有的数据，因此均方误差小。随着数据量的增加，假设函数的均方误差会增大。在图像上的体现就是，训练集学习曲线随训练数据量的增长而增长。

用于训练的数据增加，势必会加少交叉验证集的数据量。在图像上的体现就是，训练集学习曲线随训练数据量的增长而降低。

两条曲线会在某一误差率附近持平。若该误差率仍处于较高水平。那么，就说明通过增加数据量的方式，对假设函数进行优化，效果是不明显的。无需浪费时间去尝试。

优化假设函数的方式包括

（1）增加训练数据量

（2）增减特征项

（3）调整正则惩罚项 $\lambda$ 参数

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
我的人工智能之旅——假设函数模型的选择

如何选择假设函数模型通常假设函数的模型为，其中n为最高次数，那么如何来确定n的取值呢？通常的做法是，（1）确定多个n值，例如，形成多个假设函数（2）将数据集分成三部分，训练集，交叉验证集，测试集，通常所占比例分别为60%，20%，20%。（注意，测试集选定后，不再变动。）（3）使用训练集对不同的假设函数模型进行训练，确定最优参数。（注意，在训练过程中，需要假如正则化惩罚...
复制链接

扫一扫

专栏目录

breakloop CSDN认证博客专家 CSDN认证企业博客

码龄17年

175: 原创

3万+: 周排名

7680: 总排名

110万+: 访问

: 等级

8705: 积分

389: 粉丝

243: 获赞

163: 评论

726: 收藏

私信

关注

热门文章

分类专栏

最新评论

ECC签名格式
m0_62055922: 请问这个格式是在哪里找到的啊
Android NDK Camera2小结
青丶空゛: 请教有没有接口配置fps 之类的，帧率一直上不去。
Android Framework学习笔记(3)--APP的启动过程
普通网友: 引领技术潮流，是不可多得的好文，十分值得借鉴和参考。期待博主未来能够持续分享更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
android framework 学习笔记
普通网友: 干货满满，细节很到位！我也写了一篇【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、技术文档电子书籍、学习路线简历模板】文章
Android Fragment滑动切换
AK7799: FATAL EXCEPTION: main Process: com.example.myapplication, PID: 3167 java.lang.RuntimeException: Unable to start activity ComponentInfo{com.example.myapplication/com.example.myapplication.MainActivity}: java.lang.ArrayIndexOutOfBoundsException: length=3; index=3 at android.app.ActivityThread.performLaunchActivity(ActivityThread.java:2958) at android.app.ActivityThread.handleLaunchActivity(ActivityThread.java:3093) at android.app.servertransaction.LaunchActivityItem.execute(LaunchActivityItem.d

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。