- 博客(8)
- 收藏
- 关注
原创 资金流入流出打卡
资金流入流出task5训练及流程训练集划分训练集、线下验证集、线下测试集、线上测试集无时序的数据集: 简单划分、交叉验证划分等有时序的数据集:需要考虑时序,nested交叉验证等
2020-08-25 22:52:56
81
原创 资金流入流出打卡
资金流入流出打卡时间序列分解的定义时间序列是指将同一统计量的树枝按其发生的时间先后顺序排列而成的数列时间序列的变化影响因素长期趋势:会导致学序列出现明显的长期趋势循环波动:会导致序列呈现周期性波动季节性变化:会导致序列呈现出和季节变化相关的稳定的周期波动随机波动:纯随机、与时间无关时间序列分解方式加法结构或者乘法结构分解加法结构与乘法结构混合分解STL分解时间序列平滑方式简单指数平滑Holt两参数指数平滑Holt三参数指数平滑...
2020-08-24 19:37:54
92
原创 datawhale资金流入流出task2打卡
资金流入流出task2打卡基于时间序列规则的资金流入流出预测大体上有三种方式以星期为周期的中位数预测基于周期因子(以星期为周期)的预测基于周期因子(以月份为周期)的预测星期为周期的中位数预测步骤1:按星期重新组织数据步骤2:提取中位数并作预测基于周期因子(以星期为周期)的预测步骤1:计算周期因子步骤2:利用周期因子进行计算基于周期因子(以月份为周期)的预测步骤1:计算周期因子步骤2:利用周期因子进行计算...
2020-08-22 21:39:40
86
原创 天池资金流入流出预测——task1
一、赛题的理解在天池的官网查看了本次比赛的题目,对这次比赛的目标和评分体系有了一个大体的了解。赛题以蚂蚁金服资金管理为背景,要求参赛者对每日的资金流入流出进行准确预测。二、数据说明官方给了参赛者五个文件,分别解释如下1. 用户信息表2.用户申购赎回数据表3.收益率表4.上海银行间拆放利率表5.选手提交结果表...
2020-08-20 09:35:19
144
原创 天池打卡TASK4
内容介绍模型融合大体来说有如下的类型方式:1.简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank averaging),log融合stacking/blending:构建多层模型,并利用预测结果再拟合预测。boosting/bagging(在xgboost...
2020-04-04 07:42:38
89
原创 天池比赛打卡
1.线性回归模型线性回归对于特征的要求;处理长尾分布理解线性回归模型2.模型性能验证评价函数与目标函数交叉验证方法留一验证方法针对时间序列问题的验证绘制学习曲线绘制验证曲线3.嵌入式特征选择Lasso回归Ridge回归决策树4.模型对比常用线性模型常用非线性模型5.模型调参贪心调参方法网格调参方法贝叶斯调参方法小结线性回归模型的数据集要尽量调整成正态分...
2020-04-01 11:28:07
101
原创 天池比赛TASK3打卡
天池比赛TASK3打卡异常值的处理利用箱线图进行异常值的识别利用箱线图进行异常值的识别时,其判断标准是当数据值大于箱线图的上须或下须时,即可认为这样的数据点为异常点。所以如下表:判断标准结论x>Q3+1.5(Q3-Q1)或者 x<Q1-1.5(Q3-Q1)异常点x>Q3+3(Q3-Q1)或者 x<Q1-3(Q3-Q1)极...
2020-03-27 18:03:21
235
原创 天池数据分析 Task2打卡
天池数据分析 Task2missingno的使用import missingno as msnomsno.matrix(train,labels=True)#显示每个特征中存在缺失值,缺失值用白线表示msno.bar(train,labels=True)#显示每个特征的确实比例和非空值的数量情况msno.heatmap(train,labels=True)#显示特征缺失值之间的...
2020-03-23 16:22:15
115
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人