![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
M.〽
这个作者很懒,什么都没留下…
展开
-
时间序列 —— task04
特征工程基于数据分析与探索提取潜在有价值的特征特征工程的重要性特征越好,模型的性能越出色特征越好,构建的模型越简单特征越好,模型的灵活性越强特征提取基于数据分析与探索提取箱型图分析点线图分析离散型特征很重要可用于设计规则易于模型拟合,xgboost、lightgbm、catboost等都以决策树为基模型便于理解便于做特征组合在推荐系统等领域很常见简单粗暴的特征组合方式简单粗暴的进行加、减、乘、除、log、exp等运算易于生成大量特征,但会原创 2020-08-24 23:17:28 · 114 阅读 · 0 评论 -
时间序列 —— task03
时间序列模型一、时间序列预测模型时间序列分解时间序列是指将同一统计量的数值按其发生的时间先后顺序排列而成的数列常用按时间顺序排列的一组随机变量X1,X2,⋯Xt,⋯表示一个随机事件的时间序列,简记为 {Xt}时间序列的各种变化都可以归纳成四大类因素的综合影响- 长期趋势(trend):会导致序列出现明显的长期趋势- 循环波动(circle):会导致序列呈现出周期性波动- 季节性变化(season): 会导致序列呈现出和季节变化相关的稳定的周期波动.- 随机波动(immedia原创 2020-08-23 21:40:12 · 267 阅读 · 0 评论 -
时间序列 —— task01
数据探索与分析赛题:资金流入流出预测赛题地址:https://tianchi.aliyun.com/competition/entrance/231573/introduction?spm=5176.12281925.0.0.158c7137tNEr5N赛题数据:竞赛中使用的数据主要包含四个部分,分别为用户基本信息数据、用户申购赎回数据、收益率表和银行间拆借利率表。用户信息表用户信息表: user_profile_table 。总共随机抽取了约 3 万用户,其中部分用户在 2014 年 9 月份原创 2020-08-20 21:53:48 · 345 阅读 · 0 评论