机器学习-------算法(十一)

线性回归:过拟合或欠拟合

过拟合:一个假设在训练数据上能够获得比其他假设更好的拟合, 但是在训练数据外的数据集上却不能很好地拟合数据,此时认为这个假设出现了过拟合的现象。(模型过于复杂)

欠拟合:一个假设在训练数据上不能获得更好的拟合, 但是在训练数据外的数据集上也不能很好地拟合数据,此时认为这个假设出现了欠拟合的现象。(模型过于简单)

 

欠拟合:

原因:
学习到数据的特征过少
解决办法:
增加数据的特征数量

 

过拟合:

原因:
原始特征过多,存在一些嘈杂特征, 

模型过于复杂是因为模型尝试去兼顾

各个测试数据点

解决办法:
进行特征选择,消除关联性大的特征 ( 很难做 )
交叉验证 ( 让所有数据都有过训练 )
正则化 ( 了解 )


 

 

 

 

岭回归:一个加上了正则化的线性回归

主要讲解过拟合的解决方法正则化:

API:

sk learn.linear_model.Ridge

解释:

sklearn.linear_model.Ridge( alpha=1.0 )
具有 l2 正则化的线性最小二乘法
alpha: 正则化力度 0-1,1-10
coef _: 回归系数

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值