项目
想出成果的acmer
当你越来越漂亮的时候,自然有人关注你,当你越来越有能力时,自然会有人看得起你,改变自己,你才有自信,梦想会慢慢的实现,要做好你自己,懒惰可以毁掉一个人,勤奋可以激发一个人,不要等到夕阳西下的时候才对自己说如果当初…如果…我就会怎么样,之类的话,都已经晚了,我只想告诉你一句话:要做一个连自己都羡慕的人!
展开
-
项目学习笔记4 岭回归(有偏估计)
我们常用的线性回归采用最小二乘法,但是存在一个问题。当自变量间存在复共线性时,回归系数估计的方差会很大,估计值不稳定。 复共线性: 自变量数量很多且相互关联紧密,y = 10+2x1+3x2...原创 2022-05-06 11:05:47 · 810 阅读 · 0 评论 -
项目学习笔记3 过拟合、欠拟合
欠拟合”常常在模型学习能力较弱,而数据复杂度较高的情况出现,此时模型由于学习能力不足,无法学习到数据集中的“一般规律”,因而导致泛化能力弱。 与之相反,“过拟合”overfitting常常出现在模型学习能力过强的情况,此时的模型学习能力太强,以至于将训练集单个样本自身的特点都能捕捉到,并将其认为是“一般规律”,同样这种情况也会导致模型泛化能力下降。 欠拟合underfitting简单来说是对于复杂的数据直接求得函数为y = ax+b,没有找到一般规律,泛化能力不足。表现为训练集和测试集均表现不好原创 2022-05-05 16:53:29 · 589 阅读 · 0 评论 -
项目学习笔记2 交叉验证
交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某样本在下次可能成为测试集中的样本,即所谓“交叉”。 一般数据量比较少,少于1万条时,一般都会采用交叉验证。如果数据量比较大,可以分为三类。训练集用来训练数据,验证集用来评估模型的好坏并进行参数选择,测试集用来决定选择使用哪个模型。 (一) 简单交叉验证 70%的数据用来训练模型,剩余3原创 2022-05-01 19:11:47 · 453 阅读 · 0 评论 -
项目学习笔记1 R^2
R^2:决定系数。经常用来衡量回归分析的好坏。 对于一组数据,如果他们按照一个规则来计算,会有非常确定的函数表达式。比如银行存款,规则已然确定,函数自然也确定。 但是实际并没有这么确定的函数关系式,往往是这些数据遵循一定的规律,也就是相关关系。不是确定的关系,但是也不是没有关系。回归分析,就是对相关关系进行量化分析的手段。这时候就需要有个东西来衡量回归分析结果的好坏啦,就是R^2. 直观感受: 预测值y帽和实际的yi的差可以代表预测的好坏,如果相等那就预测的完美咧。但是呢,这个值有可能是负数,会正原创 2022-05-01 11:04:33 · 585 阅读 · 0 评论