Overview
- 机器学习应用领域
- 机器学习常用算法
- 常用工具
- 建模与问题解决流程
- 数据处理
- 特征工程
- 模型选择
- 寻找最佳超参数:交叉验证
- 模型分析与模型融合
- Kaggle wiki
- 实战案例
知识理论
- 数学理论
- 线性代数
- 概率论
- 数理统计
- 高等数学(微积分)
- 算法理论
- 算法导论(经典书籍)
- 计算机硬件知识理论
- 计算机软件知识理论
- 计算机语言
- Python
- C or C-plus-plus
- Java
- Golang
- 编辑器使用
- 写代码效率
- 效率高就是王道
- 编译器使用
- 构建项目工程代码编译
- make & Makefile
- CMake
- 知识架构
- 博而广之
- T 型架构
- 相关领域一定要广博,专攻领域一定要深入
- 不仅仅是技术要不断更新,业务流程也是有了解的必要
应用领域
- 经济相关:股市、房价
- 能源相关:产能预测、分配与合理利用
- NLP相关:检索、分类、主题、相似度
- CV相关:图像处理、视觉识别、目标检测
- 互联网用户行为:CTR预测
- 销量预测:电商、连锁店、超市
- 深度学习应用:数字图像理解
- 推荐系统相关:电商推荐、电影推荐、个性化推荐
- 其他预测:气候、社交网络
常用算法 algorithms
具体分类情况,要了然于心
- SVM
- SVD
- PCA
- K-means
- Linear
- Polynomial
- Decision trees
- Random Forests
- Aprori
- FP-Growth
- KNN
- Logistic Regression
- Naive-Bayes
常用工具
- Scikit-Learn
- xgboost
- TensotFlow
- Opencv
- PyTorch
- Numpy
- Pandas
- Matplotlib
- Jupyter Notebook & Jupyter Lab
- Python3
- C-plus-plus
- MapReduce
- Hive
- SQL
- Hadoop
- Spark
算法建模
- 数据处理
- 特征工程
- 算法原理(数学计算)
- 算法实现(Python、C-plus-plus)
- 模型评估
- 模型融合(集成学习)