数据挖掘
棠糖䉎
这个作者很懒,什么都没留下…
展开
-
数据挖掘实践(资金流入流出预测)—8.总结
数据挖掘实践(资金流入流出预测)—8.总结写在最后按照计划,至少会有第七步:模型的实战,后续补上。感谢这次限时提升的机会,后续会慢慢填坑掌握数据(尤其是时序数据)划分方法、建模流程掌握常用的回归模型,熟悉模型融合方法利用相关方法和工具完成资金流入流出预测赛题任务...原创 2020-08-25 22:48:30 · 176 阅读 · 0 评论 -
数据挖掘实践(资金流入流出预测)—6.建模预测(一)
数据挖掘实践(资金流入流出预测)—6.建模预测(一)一、模型训练与验证**tips**:1.1 常用的回归模型1.1.1 线性回归1.1.2 逻辑回归1.1.3 决策树1.1.4 随机森林1.1.5 梯度提升树引言这次我们要开始数据建模预测了。我们先从模型训练与验证开始。模型训练、预测及线下验证常用的回归模型模型融合一、模型训练与验证那么数据该如何划分呢?训练集、线下验证集、线下测试集、线上测试集无时序的数据集:简单划分、交叉验证划分等有时序的数据集:需考虑时序,nested交原创 2020-08-24 23:06:17 · 814 阅读 · 0 评论 -
数据挖掘实践(资金流入流出预测)—5.特征工程
数据挖掘实践(资金流入流出预测)—5.特征工程一、特征选择1.1 Filter1.1.1 方差选择法1.1.2 相关系数法1.1.3 卡方检验引言在数据预处理之前,我们先来了解下特征工程。特征工程指的是在原始数据之中提取,构造,选择数据特征的过程。有句话是:“数据和特征工程决定了你能到达的上限,机器学习模型决定了你能多么逼近这个上限”。特征工程是数据挖掘过程中一步十分重要的步骤,也是建模步骤的基础和准备。一、特征选择当数据预处理完成后,我们需要选择有意义的特征输入机器学习的算法和模型进行训练。通原创 2020-08-23 23:09:23 · 275 阅读 · 0 评论 -
数据挖掘实践(资金流入流出预测)—4.时间序列模型
数据挖掘实践(资金流入流出预测)—4.时间序列模型一、时间序列预测模型1.1 时间序列分解1.1.1 分解方法1.1.2 STL分解1.2 ARIMA模型1.2.1 自回归模型AR1.2.2 移动平均模型MA1.2.3 自回归移动平均模型ARMA1.2.4 差分自回归移动平均模型ARIMA1.3 建立ARIMA模型的过程1.3.1 模型识别和定阶1.3.2 参数估计1.3.3 模型检验写在开头上一节介绍了时间序列分析这一在量化投资中广泛使用的优秀技术,本次将对其模型展开学习。这会是一篇长更新的文章,原创 2020-08-22 23:39:35 · 533 阅读 · 0 评论 -
数据挖掘实践(资金流入流出预测)—3.时间序列规则
数据挖掘实践(资金流入流出预测)—3.时间序列规则一、时间序列分析1.1 定义1.2 特点1.3 时间序列建模基本步骤1.4 类型1.5 时间序列预测法引言&目标掌握时间序列规则的基本方法首先认识各种概念与规则,从时间序列分析开始。一、时间序列分析时间序列分析(time series analysis)是量化投资中的一门基本技术,即指在一定时间内按时间顺序测量的某个变量的取值序列。对股票价格而言,随时间变化是一个时间序列;对气温而言,随时间变化也是一个时间序列;再对金融产品而言,投资品的收原创 2020-08-21 23:06:52 · 418 阅读 · 0 评论 -
数据挖掘实践(资金流入流出预测)——2.数据探索与分析
数据挖掘实践(资金流入流出预测)——2.数据探索与分析一、探索性数据分析的思想与流程1.1 常见数据探索方法1.2 数据来源及介绍理论部分了解探索性数据分析的思想与流程熟悉常用的数据绘图与统计分析方法了解针对时间序列数据的分析方法实战部分完成数据探索与分析的代码一、探索性数据分析的思想与流程探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。1.1 常原创 2020-08-20 23:53:25 · 169 阅读 · 0 评论