3.4过拟合问题
过拟合是指为了得到一致假设而使假设变得过度严格。避免过拟合是机器学习设计中的一个核心任务
1、拟合问题的原因
①使用的模型比较复杂,学习能力过强
②有噪声存在
③数据量有限
④过拟合:做的太过好以至于偏离了原本,泛化能力差
⑤欠拟合:泛化能力强,但过于泛化
2、拟合问题的解决
①寻找参数的最优:超参数优化器
②使用sklearn中的学习曲线
train_loss,test_loss=validation_curve(SVC(),X,y,param_name='gamma',param_range=param_range,cv=10, scoring='mean_squared_error')
train_loss_mean=-np.mean(train_loss,axis=1)
test_loss_mean=-np.mean(test_loss,axis=1)