衡量参数:
训练集误差
验证或测试集的误差
查准率
查全率(查全率高:宁可错杀一千,不可放过一个)
学习曲线(训练和测试误差,随训练数据集数量的变化趋势)
两种现象:欠拟合和过拟合
先构建一个简单的应用,避免过早优化,进行误差分析,确定优化方向。
解决办法:
获取更多数据集
增加或减少特征的数量
增加多项式的使用
正则化参数lamda的增大或减小
衡量参数:
训练集误差
验证或测试集的误差
查准率
查全率(查全率高:宁可错杀一千,不可放过一个)
学习曲线(训练和测试误差,随训练数据集数量的变化趋势)
两种现象:欠拟合和过拟合
先构建一个简单的应用,避免过早优化,进行误差分析,确定优化方向。
解决办法:
获取更多数据集
增加或减少特征的数量
增加多项式的使用
正则化参数lamda的增大或减小