Kaggle竞赛知识准备

Overview

  • 机器学习应用领域
  • 机器学习常用算法
  • 常用工具
  • 建模与问题解决流程
    1. 数据处理
    2. 特征工程
    3. 模型选择
    4. 寻找最佳超参数:交叉验证
    5. 模型分析与模型融合
  • Kaggle wiki
  • 实战案例

知识理论

  • 数学理论
    • 线性代数
    • 概率论
    • 数理统计
    • 高等数学(微积分)
  • 算法理论
    • 算法导论(经典书籍)
    • 计算机硬件知识理论
    • 计算机软件知识理论
  • 计算机语言
    • Python
    • C or C-plus-plus
    • Java
    • Golang
  • 编辑器使用
    • 写代码效率
    • 效率高就是王道
  • 编译器使用
    • 构建项目工程代码编译
    • make & Makefile
    • CMake
  • 知识架构
    • 博而广之
    • T 型架构
    • 相关领域一定要广博,专攻领域一定要深入
    • 不仅仅是技术要不断更新,业务流程也是有了解的必要

应用领域

  • 经济相关:股市、房价
  • 能源相关:产能预测、分配与合理利用
  • NLP相关:检索、分类、主题、相似度
  • CV相关:图像处理、视觉识别、目标检测
  • 互联网用户行为:CTR预测
  • 销量预测:电商、连锁店、超市
  • 深度学习应用:数字图像理解
  • 推荐系统相关:电商推荐、电影推荐、个性化推荐
  • 其他预测:气候、社交网络

常用算法 algorithms

具体分类情况,要了然于心

  • SVM
  • SVD
  • PCA
  • K-means
  • Linear
  • Polynomial
  • Decision trees
  • Random Forests
  • Aprori
  • FP-Growth
  • KNN
  • Logistic Regression
  • Naive-Bayes

常用工具

  • Scikit-Learn
  • xgboost
  • TensotFlow
  • Opencv
  • PyTorch
  • Numpy
  • Pandas
  • Matplotlib
  • Jupyter Notebook & Jupyter Lab
  • Python3
  • C-plus-plus
  • MapReduce
  • Hive
  • SQL
  • Hadoop
  • Spark

算法建模

  • 数据处理
  • 特征工程
  • 算法原理(数学计算)
  • 算法实现(Python、C-plus-plus)
  • 模型评估
  • 模型融合(集成学习)
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值