回归分析
文章平均质量分 58
山高月小 水落石出
在广袤的空间和无限的时间中,能与你共享同一颗行星和同一段时光,是我莫大的荣幸。
展开
-
State space, 状态空间方法简介
状态空间方法简介原创 2023-01-26 20:37:54 · 507 阅读 · 0 评论 -
Model selection, 模型评价之AIC, AIC(c), BIC
所以当训练模型所用的数据个数相同时,三种准则对不同模型的优选结果相同,只是相对数值会有不同;当不需要使用结果数值来加权,只是对模型排序优选时,用任一种准则都是与其他准则等价的。更好些,因为考虑数据个数的准则优选出的模型更可能避免过拟合,更适合于比较那些需要更多数据的多参数模型,例如基于树的集成类模型和神经网络等。,即log(T)=2时的特殊情况,即BIC是在AIC的基础上考虑了数据个数的广义表达式;当训练数据个数不等,例如比较周序列和日序列的同一种模型时,用BIC和AIC。也是考虑了数据个数的广义表达式。原创 2023-01-26 20:24:17 · 2063 阅读 · 0 评论 -
两类时间序列的预测方法在原理和适用情况上的简要对比
另一类特征是某种形态的趋势,如线性、sigmoid、指数、对数趋势等。只是在预测期无法获取的feature的维度越多,预测准确度就越受到能获取的features的影响,以及不能获取的features的在训练集和预测期上特征变化程度大小的影响等。多变量的时间序列分析方法,如Prophet,VARMAX,DynamicFactor等,相对于单变量的时序方法,除自身时变规律外,target还受会到不太多的几个重要feature的影响,会使自身序列的特征在某些情况下产生不与时间相关、而与feature相关的变化。原创 2023-01-26 20:10:41 · 744 阅读 · 0 评论 -
回归问题:采用SSE作目标函数去拟合一元一次、二元一次、n 元一次、n 元 n 次函数来构造损失函数,并可做梯度下降得到局部最优解(即普通最小二乘法 OLS)
回归问题:采用最小二乘法拟合多元多次函数来构造损失函数第一张图是当模型为一元一次函数时的情况,以及其loss函数(二元二次函数)的图像是如何由函数的子项形成的,以及二元二次函数梯度的不同对学习率的影响。一般来说采用全量梯度下降时函数图像最陡,批量梯度下降次之,随机梯度下降或者说逐样本梯度下降最缓。第二张图是采用逐样本梯度下降的情况。第三张图是模型为二元一次函数时的情况,这时其loss函数...原创 2018-10-14 14:16:33 · 4975 阅读 · 2 评论 -
使用插值方法(scipy.interpolate)和三维数据构造二元函数
自变量保持顺序的方式传入插值函数,所得函数就可以保持原始数据应有的顺序和规律性;如果乱序传入,因为插值函数是按逐个数据点的顺序进行插值,所得函数就可能被切分为很多零散的曲面或超曲面。平滑因子s和样条灵活性kx和ky是插值函数最重要的超参数:s越大,函数越平滑,对数据点的拟合程度就越不是完全拟合;kx,ky越大,函数越灵活,(如kx=ky=1时则为平面插值),但也越可能出现振荡。......原创 2022-08-16 17:44:00 · 1184 阅读 · 2 评论 -
一些常用的判断预测、拟合、回归的精度评价函数和相关性评价函数
import pandas as pdimport matplotlib.pyplot as pltimport numpy as npimport randomimport seaborn as snsfrom sklearn import metricsfrom statsmodels.tools import eval_measuresfrom scipy import statsimport pandas as pdfrom warnings import filterwarni.原创 2020-11-04 15:31:32 · 6687 阅读 · 2 评论