人工智能
文章平均质量分 75
人工智能
aaakirito
GRIT
展开
-
趋势预测方法(八)Light GBM_决策树
Light GBMa基本原理:基本原理同XGBoost、GBDT决策树相同,属于在XGBoost的基础上的再一次的提升。在精度上和GBDT、XGBoost一致或更优的情况下,效率上大幅领先于XGBoost和GBDT。用多个回归树将来拟合训练集,拟合好的模型需要做到多个回归树的结果之和训练集的结果一致,将该模型保存起来,之后只需要将要预测的数据再过一遍模型,即可得到预测数据结果。b算法原理:对比GBDT和XGBoost来说,不需要通过所有样本计算信息增益了,而且内置特征降维技术,所以更快。原创 2021-05-24 16:12:43 · 1675 阅读 · 1 评论 -
趋势预测方法(七)XGBoost_决策树
XGBoosta基本原理:XGBoost算法预测时序数据的原理和GBDT算法原理类似,这里大致再提一下。用多个回归树将来拟合训练集,拟合好的模型需要做到多个回归树的结果之和训练集的结果一致,将该模型保存起来,之后只需要将要预测的数据再过一遍模型,即可得到预测数据结果。b算法原理:XGBoost(由陈天奇大佬开发,可以理解为X (Extreme) GBoosted)算法可以看作是GBDT算法的plus版本,本质上还是一个GBDT。XGBoost与GBDT的区别主要还是目标函数的不同,.原创 2021-05-24 16:06:32 · 1667 阅读 · 8 评论 -
趋势预测方法(六)梯度下降树GBDT_决策树
梯度下降树GBDTa基本原理:利用梯度下降(提升)树GBDT算法拟合出最优的决策树,将拟合好的决策树保存下来。若出现需要预测的数据,只要将数据过一遍决策树,就可以获得预测的数值结果。在下文我会写梯度下讲树的工作原理。b算法原理:回归树GBDT梯度下降树GBDT的核心就在于,每一棵树学的是之前所有树结论和的残差,这个残差就是一个加预测值后能得真实值的累加量。如存在一个真实值为20(真实值在test中并不会给出,这里只是便于理解),第一个树得到的预测值是12,那就目前来看真实值和原创 2021-05-24 15:58:55 · 2653 阅读 · 0 评论 -
趋势预测方法(五)Holt-Winters模型_时序递推预测
Holt-Winters模型a基本原理:该方法有点类似于SMA(移动平均)的思路,是对SMA的优化。主要因为SMA的参数数量过多时,计算时间慢,且计算复杂。Holt-Winters利用三次指数平滑法,将历史时序数据输入三个递推序列,再由三个序列的递推值来推算出预测数据的值。该模型的目的是训练出三次指数平滑法三个因数的最有效的取值,之后就可以继续预测了。该方法可以有效的预测有线性趋势和周期波动的非平稳序列。b模型原理:简单指数平滑:二次指数平滑:三次指数平滑:在二次指数原创 2021-05-24 15:49:25 · 10200 阅读 · 8 评论 -
趋势预测方法(四)高斯过程回归_时序概率性预测
高斯过程回归(GPR)a基本原理:利用高斯过程回归将可能的数据趋势曲线都保存下来(每条趋势曲线都有自己的置信度,在区间内呈高斯分布),最后在一张图中显示出来,再判断总体的趋势情况。b算法原理:高斯过程GP高斯过程回归GPR核函数Kernel支持向量机(SVM)通过某非线性变换 φ( x) ,将输入空间映射到高维特征空间。特征空间的维数可能非常高。如果支持向量机的求解只用到内积运算,而在低维输入空间又存在某个函数 K(x, x′) ,它恰好等于在高维空间中这个内积.原创 2021-05-21 15:32:10 · 7626 阅读 · 1 评论 -
趋势预测方法(三)ARMA ARIMA SARIMA模型预测_时序递推预测
ARMA/ARIMA/SARIMA模型预测a基本原理:这三种模型都是用来预测时序性数据。其中ARIMA和SARIMA是由ARMA模型演变过来的,而ARMA是由AR模型(自回归模型)和MA模型(移动平均模型)组合出来的(AR模型和MA模型会在下文讲解)。假设有一个时间节点t。AR做的事是利用t之前的随机变量来预测t之后随机变量;MA做的事是利用t之前(包括t)的随机误差项和滞后误差项,来形成一个误差项模型。AR模型可以理解成ARMA模型的一种特殊的形式,相对而言ARMA功能更强大。A.原创 2021-05-17 18:11:34 · 8731 阅读 · 0 评论 -
趋势预测方法(二)其他函数拟合_函数拟合
其它函数拟合a基本原理:给出公式的大致情况,自动去拟合出最优的参数。这里的其它指的是除多项式以外的拟合情况,包括三角函数、对数,以及一些复杂的复合函数。b拟合原理:总体思路类似于最小二乘法的拟合思路的,只是要给出函数的大致情况,类似于多项式中的几次多项式拟合。c方法优缺点:优点: 思想简单,实现容易。建模迅速,对于小数据量、简单的关系很有效。 解决回归问题,拥有很好的解释性。 是很多非线性模型的基础。 缺点: 对于非线性数据或者数据特征..原创 2021-05-17 17:55:20 · 1785 阅读 · 4 评论 -
趋势预测方法(一) 多项式拟合(最小二乘法)_函数拟合
多项式拟合(最小二乘法)a基本原理:b拟合函数原理:c方法优缺点:优点: 思想简单,实现容易。建模迅速,对于小数据量、简单的关系很有效。 解决回归问题,拥有很好的解释性。 是很多非线性模型的基础。 缺点: 对于非线性数据或者数据特征间具有相关性多项式回归难以建模。 当样本特征n非常大的时候会变的很耗时,难以很好的表达复杂的数据。 需要做预测的话需要数据大致满足多项式函数。 d算法入口:该方法主要用到的函数是n..原创 2021-05-17 17:49:53 · 11487 阅读 · 0 评论 -
趋势检验方法(四)ADF稳定性检验
ADF稳定性检验a基本原理:使用ADF来检验时序数据中是否存在单位根,若存在单位根,则不稳定,否则稳定。为什么存在单位根不稳定?这个问题的答案可以参考知乎《为什么序列存在单位根是非平稳时间序列?》,解释起来有点复杂。大致来说就是平稳的定义是一阶二阶矩阵不随时间的改变而改变,而存在单位根则代表二阶矩阵随时间的改变而改变。b单位根检验:单位根是什么?单位根如何检验?假设H0为存在单位根,Ha为不存在单位根。如果得到的显著性检验统计量小于三个置信度(10%,..原创 2021-05-11 13:55:42 · 4773 阅读 · 0 评论 -
趋势检验方法(三)Cox-stuart趋势检验
Cox-stuart趋势检验a基本原理:Cox-Stuart是一种不依赖趋势结构的快速判断趋势是否存在的方法。该方法的理论基础是符号检验。先假设H0和Ha(共三组),然后间隔一个时间c,生成c对差值的符号,然后分别计算符号为正和符号为负的数量,最后再对三组假设进行检验统计量计算,再判断假设是否成立。b Cox-stuart算法理论:c方法优缺点:优点:不依赖趋势结构,可以快速判断出趋势是否存在。缺点:未考虑数据的时序性,仅仅只能通过符号检验来判断。d算法入口:目.原创 2021-05-11 11:21:12 · 10821 阅读 · 0 评论 -
趋势检验方法(二)MK趋势检验
MK(Mann-Kendall)检验a基本原理:使用MK算法检验时序数据大致趋势,趋势分为无明显趋势(稳定)、趋势上升、趋势下降。MK检验的基础:当没有趋势时,随时间获得的数据是独立同分布的,数据随着时间不是连续相关的。 所获得的时间序列上的数据代表了采样时的真实条件,样本要具有代表性。 MK检验不要求数据是正态分布,也不要求变化趋势是线性的。 如果有缺失值或者值低于一个或多个检测限制,是可以计算MK检测的,但检测性 能会受到不利影响。 独立性假设要求样本之间的时间足够大,这样在不同原创 2021-05-10 16:47:03 · 73478 阅读 · 24 评论 -
趋势检验方法(一)直线方程拟合
直线方程拟合a基本原理:设一条直线为y=kx+b,使用最小二乘法()来拟合出最优的k(斜率)。 设定一个阈值k0(k0>0),若|k|>k0则认为趋势有明显变化。当k>k0时,则认为 有上升的趋势;当k<-k0时,则认为有下降的趋势。 |k|<=k0时可以视情况考虑是否要进行趋势稳定性检测。b拟合函数原理:假设需要拟合的函数为y=kx+b那么最小二乘法的本质是要使每一个点到y=kx+b的垂直距离平方和最小,从而算出k和b具体实现步骤:c方.原创 2021-05-10 16:37:04 · 6797 阅读 · 1 评论 -
python数据分析基础class 4(IPython的使用(2))
Ipython是一个加强版的python解释器Ipython中大多数Python对象被格式化为更可读、更美观的形式Ipython的补全功能使用<tab>键可以产生补全的效果,默认下不产生以下划线为开头的补全Ipython的内省功能在对象后面加?可以显示对象的具体信息在函数后面加?可以显示函数内部的字符串信息在函数后面加??可以显示函数的源代码...原创 2020-05-06 10:14:44 · 216 阅读 · 0 评论 -
python数据分析基础class 3
原创 2020-05-06 09:18:24 · 129 阅读 · 0 评论 -
python数据分析基础class 2(引力波的绘制)
引力波数据https://www.python123.io/dv/grawave.html# 引力波import numpy as npimport matplotlib.pyplot as pltfrom scipy.io import wavfilerate_h, hstrain = wavfile.re...原创 2020-05-06 09:08:19 · 465 阅读 · 0 评论 -
python数据分析基础class 1(图像素描)
图像素描,这里使用一张冷鸟的微博图来做示范import numpy as npfrom PIL import Imagea = np.asarray(Image.open('yousa.jpg').convert('L')).astype(np.float)depth = 12 # (0-100)grad = np.gradient(...原创 2020-04-29 17:05:07 · 184 阅读 · 0 评论 -
双曲函数讲解
写的很牛的文章https://zhuanlan.zhihu.com/p/20042215https://blog.csdn.net/qq_41601836/article/details/104264922(同一篇,防止链接失效)转载 2020-04-18 21:56:10 · 551 阅读 · 0 评论 -
样本方差、母体方差、样本标准差、母体标准差
方差和标准差是概率与统计学里经常用到的知识在网上看到不少关于方差的研究和讨论,所以这里整合一下方差和标准差的区别一般来说方差的公式是(σ^2)S^2=……而标准差则是将方差开根号S(σ)=……由于方差和标准差差一个根号,所以接下来我主要介绍样本方差和母体方差,样本标准差和母体标准差的区别可以依样画葫芦样本方差和母体方差的区别这里我先举一个例子简单的说明...原创 2020-03-09 15:06:36 · 20546 阅读 · 1 评论 -
自适应线性神经元
1、线性神经元模型这里先说一下,一般我们学习映射问题,都是先从“线性映射”开始,然后深入到“非线性映射”,之间最主要的差别就是映射函数f(x):X---->Y,到底是线性的,还是非线性的。所以,线性神经元模型的激活函数肯定就是线性的。我们首先来看下面的图:(图片均来自网络)图1:线性神经元模型解释一下:首先,我们输入训练样本X和初始化权重向量W,将其进行向量的点乘,然后将点乘求和的结果作用于...翻译 2018-03-27 11:33:34 · 2218 阅读 · 0 评论