数据挖掘
M.〽
这个作者很懒,什么都没留下…
展开
-
时间序列 —— task04
特征工程 基于数据分析与探索提取潜在有价值的特征 特征工程的重要性 特征越好,模型的性能越出色 特征越好,构建的模型越简单 特征越好,模型的灵活性越强 特征提取 基于数据分析与探索提取 箱型图分析 点线图分析 离散型特征很重要 可用于设计规则 易于模型拟合,xgboost、lightgbm、catboost等都以决策树为基模型 便于理解 便于做特征组合 在推荐系统等领域很常见 简单粗暴的特征组合方式 简单粗暴的进行加、减、乘、除、log、exp等运算 易于生成大量特征,但会原创 2020-08-24 23:17:28 · 103 阅读 · 0 评论 -
时间序列 —— task03
时间序列模型 一、时间序列预测模型 时间序列分解 时间序列是指将同一统计量的数值按其发生的时间先后顺序排列而成的数列 常用按时间顺序排列的一组随机变量X1,X2,⋯Xt,⋯ 表示一个随机事件的时间序列,简记为 {Xt} 时间序列的各种变化都可以归纳成四大类因素的综合影响 - 长期趋势(trend):会导致序列出现明显的长期趋势 - 循环波动(circle):会导致序列呈现出周期性波动 - 季节性变化(season): 会导致序列呈现出和季节变化相关的稳定的周期波动. - 随机波动(immedia原创 2020-08-23 21:40:12 · 256 阅读 · 0 评论 -
时间序列 —— task01
数据探索与分析 赛题:资金流入流出预测 赛题地址:https://tianchi.aliyun.com/competition/entrance/231573/introduction?spm=5176.12281925.0.0.158c7137tNEr5N 赛题数据:竞赛中使用的数据主要包含四个部分,分别为用户基本信息数据、用户申购赎回数据、收益率表和银行间拆借利率表。 用户信息表 用户信息表: user_profile_table 。总共随机抽取了约 3 万用户,其中部分用户在 2014 年 9 月份原创 2020-08-20 21:53:48 · 340 阅读 · 0 评论