模型算法
abc200941410128
这个作者很懒,什么都没留下…
展开
-
Python做时间序列预测的11种经典方法
11 Classical Time Series Forecasting Methods in Python (Cheat Sheet)https://machinelearningmastery.com/time-series-forecasting-methods-in-python-cheat-sheet/转载 2020-12-28 20:29:39 · 1043 阅读 · 0 评论 -
将含时间序列字段的数据集转换为一般的监督学习问题(python)
一、前言: 时间序列算法的局限性一是,可用的算法较少,一般机器学习算法都不适用。无论是单一字段的时间序列还是多元时间序列,在现实场景中可用的算法都比较固定,一般都是(单一ARIMA,多元VARMAX)2种算法的延伸或者变种。二是,应用场景不多,往往都伴随着其他非时间序列的影响因素(如,性别,地区等数值或非数值类型)。二、方法介绍1、时间上的因素拉平标题可能起的不太好,意思很简单,就是将前1天~前n天的数都作为影响因素/字段(需要后几天的同理)。代码如下:###序列特征转监督学习def seri原创 2020-12-28 20:28:32 · 703 阅读 · 2 评论 -
时间序列模型步骤教程(ARIMA)
什么是时间序列时间序列简单的说就是各时间点上形成的数值序列,时间序列分析就是通过观察历史数据预测未来的值。在这里需要强调一点的是,时间序列分析并不是关于时间的回归,它主要是研究自身的变化规律的(这里不考虑含外生变量的时间序列)。时间序列的分析的步骤是先对数据进行平稳性和非白噪声检验(如不满足需对数据进行平滑或差分等预处理),然后才是模型调参跟预测,因此本文分为2大部分介绍,答题思路见脑图。一、数据准备&探索1、平稳性序列平稳性是进行时间序列分析的前提条件为什么要满足平稳性的要求呢?在大数原创 2020-10-29 19:17:17 · 33853 阅读 · 2 评论 -
贝叶斯公式的理解(先验后验的区别)和极大似然估计
目录一、贝叶斯公式的理解1、条件概率2、全概率公式3、贝叶斯公式4、先验概率和后验二、极大似然估计例子参考文章:一、贝叶斯公式的理解一直容易把最基础的贝叶斯公式里的概念搞混(主要是先验后验)。先上核心知识,贝叶斯公式是P(B|A)=P(A|B)P(B)/P(A)贝叶斯公式就是当已知结果,问导致这个结果的第i原因的可能性是多少?执果索因!先验概率是指根据以往经验和分析得到的概率,如全概率公式,它往往作为"由因求果"问题中的"因"出现.(一般在计算中已知的原因和结果就是先验)后验概率是指依据得到"结原创 2020-09-13 01:06:22 · 6878 阅读 · 0 评论 -
xgboost和lightgbm算法总结(从决策树到xgboost)
xgboost和lightGBM在中外各种比赛(如kaggle)中使用频率最多的一种算法之一(若不是最近几年竞赛数据越来越多图片文本语言类数据,甚至可以去掉之一)。xgboost和lightGBM是一个基于树模型的分布式Boosting算法,并不是如逻辑回归,支持向量机等单一的算法模型,因此在介绍xgboost和lightGBM算法前需对比介绍决策树、随机森林、ababoost、GBDT等算法和相...原创 2020-05-05 22:08:58 · 5214 阅读 · 1 评论 -
机器学习中的范数规则化L0、L1与L2范数
机器学习中的范数规则化L0、L1与L2范数zouxy09@qq.comhttp://blog.csdn.net/zouxy09 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化。我们先简单的来理解下常用的L0、L1、L2和核范数规则化。最后聊下规则化项参数的选择问题。这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文。知识有限,以下都是我一些转载 2018-01-29 22:36:08 · 2472 阅读 · 0 评论 -
深度学习常见算法的介绍和比较
很多人都有误解,以为深度学习比机器学习先进。其实深度学习是机器学习的一个分支。可以理解为具有多层结构的模型。具体的话,深度学习是机器学习中的具有深层结构的神经网络算法,即机器学习>神经网络算法>深度神经网络(深度学习)。 关于深度学习的理论推导,太大太复杂,一些常见的深度学习算法本人也是模模糊糊的,看过好多次的,隔断时间就会忘记,现在对其系统的整理一下(从历史,致命问题出发,再看具体算法的思想,原创 2018-02-08 22:00:06 · 126311 阅读 · 4 评论 -
机器学习中的维度灾难
一、介绍本篇文章,我们将讨论所谓的“维度灾难”,并解释在设计一个分类器时它为何如此重要。在下面几节中我将对这个概念进行直观的解释,并通过一个由于维度灾难导致的过拟合的例子来讲解。考虑这样一个例子,我们有一些图片,每张图片描绘的是小猫或者小狗。我们试图构建一个分类器来自动识别图片中是猫还是狗。要做到这一点,我们首先需要考虑猫、狗的量化特征,这样分类器算法才能利用这些特征对图片进行分类。例如我们可以通转载 2018-01-09 15:38:39 · 3800 阅读 · 0 评论 -
各种聚类算法的介绍和比较
一、简要介绍1、聚类概念聚类就是按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。即聚类后同一类的数据尽可能聚集到一起,不同数据尽量分离。2、聚类和分类的区别聚类技术通常又被称为无监督学习,因为与监督学习不同,在聚类中那些表示数据类别的分类或者分组信息是没有的。Clustering (聚类),原创 2017-11-15 15:25:00 · 133257 阅读 · 19 评论