思考: “泛化”是任人打扮的小姑娘

最新推荐文章于 2021-07-21 14:59:57 发布

JNingWei

最新推荐文章于 2021-07-21 14:59:57 发布

阅读量527

点赞数 1

分类专栏： Idea与思考

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jningwei/article/details/79110432

版权

Idea与思考专栏收录该内容

8 篇文章 10 订阅

订阅专栏

官方定义

在周老师的《机器学习》一书 (P3) 中，泛化能力一词定义如下：

学得模型适用于新样本的能力，称为 “泛化”（generalization）能力。

同理，泛化误差的存在就是为了防止学习器把训练样本学得太好了，导致可能已经把训练样本自身的一些特点当做了所有潜在样本都会具有的一般性质。

缺陷

因为泛化性能是建立在 主观臆测 的沙雕之上，只是一种 对个人假想的“实际情况”的模拟 。因此，没有人能对尚未出现的新样本的 分布特点 做出保证正确的限定。

“泛化”是任人打扮的小姑娘

具体举例，比如有些解决不平衡样本的方法，是通过加大对量少类别样本的采样来提高模型的泛化性能的。
在测试样本中，如果新样本的 分布特点 是各类样本数量均衡，那么上述解决方法当然是行之有效的。
但是如果新样本的 分布特点 符合马太效应而多者愈多呢？那么上述解决方法似乎就与 新定义的“泛化” 背道而驰了。
反之亦然。

总结

一切真理都是有前提的。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
思考: “泛化”是任人打扮的小姑娘

官方定义在周老师的《机器学习》一书 (P3) 中，泛化能力一词定义如下：学得模型适用于新样本的能力，称为 “泛化”（generalization）能力。同理，泛化误差的存在就是为了防止学习器把训练样本学得太好了，导致可能已经把训练样本自身的一些特点当做了所有潜在样本都会具有的一般性质。缺陷因为泛化性能是建立在主观臆测的沙雕之上，只是一种对个人假想的“实际情况”的模拟...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。