机器学习
定义:自动从已有数据中找出一些规律,把学到的这些规律应用到对未来数据的预测中,或者在不确定环境下自动的做决策
分类:
监督学习:
- 线性回归
- 逻辑回归
- 朴素贝叶斯
- 神经网络
- SVM
- 随机森林
- Adaboost
- CNN
无监督学习:
- K-means 聚类
- PCA 协方差矩阵降维
- ICA 降维
- MF 矩阵分解降维 推荐系统
- LSA
- LDA 分析主题
生成模型:学习特点
判别模型:学习区别
监督学习 | 无监督学习 | |
---|---|---|
生成模型 | Naive Bayes | HMM模型、LDA,GMM |
判别模型 | 逻辑回归、CRF模型 |
建模过程
数据→清洗→特征工程(特诊决定系统上限,选择模型不断逼近上限)→建模→预测
端到端方法:不做特征工程 例如seq2seq 更多用于图像识别
数据
训练数据:搭建模型
测试数据:测试模型