kaggle 经典案例掌握机器学习算法的通用流程

目录

1 通过 kaggle 经典案例掌握机器学习算法的通用流程

1.1 机器学习应用领域

  • 经济相关 : 股市 、 房价等
  • 能源相关 : 产能预测 、 分配与合理利用
  • NLP 相关 : 检索 、 分类 、 主题 、 相似度
  • 互联网用户行为 : CTR 预测
  • 销量预测 : 电商 、 连锁店 、 超市 …
  • 深度学习应用 : 图像内容理解
  • 推荐系统相关 : 电商推荐
  • 其他预测 : 气候 、

1.2 机器学习常用算法

1.3 常用工具

1.4 建模与问题解决流程

1.4.1 解决问题流程

  • 了解场景和目标
  • 了解评估准则
  • 认识数据
  • 数据预处理( 清洗 , 调权 )
  • 特征工程
  • 模型调参
  • 模型状态分析
  • 模型融合

学习参考链接:
http://blog.csdn.net/han_xiaoyang/article/details/50469334 http://blog.csdn.net/han_xiaoyang/article/details/52910022

1.4.2 数据预处理(清洗,调权)

  • 数据清洗
    不可信的样本丢掉
     缺省值极多的字段考虑不用
  • 数据采样
     下/上采样
    保证样本均衡
  • 工具
     hive sql/spark sql

1.4.3 特征工程、模型选择、交叉验证

1.4.3.1 特征工程

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值