Bias vs. Variance(2)--regularization and bias/variance,如何选择合适的regularization parameter λ(model selec...

最新推荐文章于 2019-04-26 18:36:40 发布

Rki-dor

最新推荐文章于 2019-04-26 18:36:40 发布

阅读量75

点赞数

原文链接：http://www.cnblogs.com/yan2015/p/5051667.html

版权

Linear regression with regularization

当我们的λ很大时，h_θ(x)≈θ₀,是一条直线,会出现underfit；当我们的λ很小时(=0时)，即相当于没有做regularization,会出现overfit;只有当我们的λ取intermediate值时，才会刚刚好。那么我们怎么自动来选择这个λ的值呢？

正则化时的J_train(θ),J_cv(θ),J_test(θ)的表达式

正则化时的J_train(θ),J_cv(θ),J_test(θ)的表达式不带有regularization式子，cost function J(θ)有regularization式子

怎样选择regularization parameter λ(model selection for λ)

计算不同的 λ的值(从0至10.24(为了方便写成10)，下一个是上一个的二倍)的cost function,求出使cost function最小的parametersθ,然后再计算J_cv(θ),选择最小的J_cv(θ)的那个model,如上图中是θ(5)以及其对应的λ的值,然后再计算test error,看其预测准确率.

J_train(θ)(how well my hypothesis do on trainning set),J_cv(θ)(how well my hypothesis do on validation set)与λ的关系

当λ很小时，可以认为没有做正则化，则会出现overfitting(high variance)现象,即J_train(θ)很小但是J_cv(θ)很大；当λ很大时，会出现underfit(high bias)现象，即J_train(θ)与J_cv(θ)都很大;

上面的这个图有点理想化，实际数据画出来的图可能会有些噪声与曲折，但是大致曲线的走向是一致的，所以我们可以通过画这样一个图来看我们设置的λ的值是否适合，或者通过编制程序来自动选择最合适的那个λ的值

转载于:https://www.cnblogs.com/yan2015/p/5051667.html

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Bias vs. Variance(2)--regularization and bias/variance,如何选择合适的regularization parameter λ(model selec...

Linear regression with regularization当我们的λ很大时，hθ(x)≈θ0,是一条直线,会出现underfit；当我们的λ很小时(=0时)，即相当于没有做regularization,会出现overfit;只有当我们的λ取intermediate值时，才会刚刚好。那么我们怎么自动来选择这个λ的值呢？正则化时的Jtrain(θ),Jcv(θ),Jtest...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。