监督学习
分类 k-近邻算法、决策树、贝叶斯、逻辑回归(LR)、支持向量机(SVM)
回归 线性回归、岭回归
标注 隐马尔可夫模型(HMM)
无监督学习
聚类 k-means
如果想要预测目标变量的值,则可以选择监督学习算法。
如果不想预测目标变量的值,则可以选择无监督算法。
如果目标变量是离散型,如是/否、1/2/3,A/B/C/或者红/黑/黄等,则可以选择分类算法;如果目标变量是连续的数值,如0.0~100.0、-999~999等,则需要选择回归算法
交叉验证
训练集与测试集的分割可以使用cross_validation中的train_test_split方法
- 没有看懂呢
**
estimator的工作流程
**
fit方法用于从训练集中学习模型参数
transform用学习到的参数转换数据