项目_想出成果的acmer的博客-CSDN博客

项目

关注

关注数：文章数：4 文章阅读量：2435 文章收藏量：1

作者: 想出成果的acmer

当你越来越漂亮的时候，自然有人关注你，当你越来越有能力时，自然会有人看得起你，改变自己，你才有自信，梦想会慢慢的实现，要做好你自己，懒惰可以毁掉一个人，勤奋可以激发一个人，不要等到夕阳西下的时候才对自己说如果当初…如果…我就会怎么样，之类的话，都已经晚了，我只想告诉你一句话：要做一个连自己都羡慕的人！

展开

项目学习笔记4 岭回归(有偏估计)

我们常用的线性回归采用最小二乘法，但是存在一个问题。当自变量间存在复共线性时，回归系数估计的方差会很大，估计值不稳定。复共线性: 自变量数量很多且相互关联紧密，y = 10+2x1+3x2...

原创 2022-05-06 11:05:47 · 810 阅读 · 0 评论
项目学习笔记3 过拟合、欠拟合

欠拟合”常常在模型学习能力较弱，而数据复杂度较高的情况出现，此时模型由于学习能力不足，无法学习到数据集中的“一般规律”，因而导致泛化能力弱。与之相反，“过拟合”overfitting常常出现在模型学习能力过强的情况，此时的模型学习能力太强，以至于将训练集单个样本自身的特点都能捕捉到，并将其认为是“一般规律”，同样这种情况也会导致模型泛化能力下降。欠拟合underfitting简单来说是对于复杂的数据直接求得函数为y = ax+b，没有找到一般规律，泛化能力不足。表现为训练集和测试集均表现不好

原创 2022-05-05 16:53:29 · 589 阅读 · 0 评论
项目学习笔记2 交叉验证

交叉验证，顾名思义，就是重复的使用数据，把得到的样本数据进行切分，组合为不同的训练集和测试集，用训练集来训练模型，用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集，某次训练集中的某样本在下次可能成为测试集中的样本，即所谓“交叉”。一般数据量比较少，少于1万条时，一般都会采用交叉验证。如果数据量比较大，可以分为三类。训练集用来训练数据，验证集用来评估模型的好坏并进行参数选择，测试集用来决定选择使用哪个模型。 (一) 简单交叉验证 70%的数据用来训练模型，剩余3

原创 2022-05-01 19:11:47 · 453 阅读 · 0 评论
项目学习笔记1 R^2

R^2:决定系数。经常用来衡量回归分析的好坏。对于一组数据，如果他们按照一个规则来计算，会有非常确定的函数表达式。比如银行存款，规则已然确定，函数自然也确定。但是实际并没有这么确定的函数关系式，往往是这些数据遵循一定的规律，也就是相关关系。不是确定的关系，但是也不是没有关系。回归分析，就是对相关关系进行量化分析的手段。这时候就需要有个东西来衡量回归分析结果的好坏啦，就是R^2. 直观感受: 预测值y帽和实际的yi的差可以代表预测的好坏，如果相等那就预测的完美咧。但是呢，这个值有可能是负数，会正

原创 2022-05-01 11:04:33 · 585 阅读 · 0 评论

项目

作者: 想出成果的acmer

项目学习笔记4 岭回归(有偏估计)

项目学习笔记3 过拟合、欠拟合

项目学习笔记2 交叉验证

项目学习笔记1 R^2