人工智能导论

haf-Lydia

于 2021-12-29 17:19:09 发布

阅读量476

点赞数

分类专栏：人工智能导论文章标签：人工智能机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45796142/article/details/122220632

版权

本文探讨了如何评价机器学习模型的泛化能力，包括使用测试集进行评估、选择性能指标、理解查准率和查全率、k-折交叉验证以及ROC曲线。强调了泛化性能的重要性，并指出训练集和测试集的选择对模型性能的影响。

摘要由CSDN通过智能技术生成

怎么对模型的好坏进行评价，对机器学习的泛化能力进行提高，增强泛化能力。
泛化能力：对训练后的数据进行分类，得到的性能和指标
不好获取所有的样本，所有的模型泛化能力的评估。一个准确的泛化能力的评估，把所有的西瓜收集过来进行预测得到的结果是一个精确的结果。但是实际情况中不可能实现，不可能搜集到一个问题所有的样本，用一个测试集上的数据来对所有未知样本的一个抽样，用测试集合对模型进行评估，得到一个测试性能，用测试性能得到泛化性能。
泛化性能是终极目标，但是不能做到，不能收集所有的样本。用有限的测试集得到所有未知样本的抽样，在测试集上面进行模型的评估。
得到的测试性能非常依赖测试集的数据，不同的测试集得到的数据的测试性能是不一样的，所以用什么样的测试集来进行测试是一个值得思考的问题。让泛化性能近似等于测试性能。
确定一个实验方法进行测试性能的评估，能够比较好的估计泛化性能。设置一个性能度量的指标，用什么指标来量化说明模型的好坏。
训练集数据越丰富，训练过程当中得到的效果更好，减少过拟合，训练集要尽可能多，但是测试集也不能太少。
测试集占有比较小的比例，1/5或者1/3

训练集比测试集多
测试集占比1/5或者1/3
训练集和测试集一定是互斥的，没有交集
训练集进行变化，测试集也进行变化，得到的训练结果就会变化，训练结果对测试集有着依赖。
留出法：
保持数据的分布一致性，分层采样？？不是很懂什么意思

多次重复划分，100次随机划分
测试集不能太大或者太小

k-折交叉验证（留一法）

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

haf-Lydia CSDN认证博客专家 CSDN认证企业博客

码龄5年

56: 原创

45万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

860: 积分

304: 粉丝

299: 获赞

2: 评论

240: 收藏

私信

关注

热门文章

分类专栏

最新评论

001链表反转
CSDN-Ada助手: 恭喜你写了第19篇博客！链表反转是一个很有用的算法，你讲解得非常清楚，让我受益匪浅。希望你能继续保持创作的热情，不断分享自己的学习和经验。下一步，我建议你可以尝试写一些关于链表其他常见操作的博客，比如插入、删除等，这样可以让读者更全面地了解链表的操作。加油！期待你更多的精彩内容！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。