简单的机器学习流程
图一:
图二:
图三:
训练集/验证集(开发集)/测试集
在机器学习和模式识别等领域中,一般需要将样本分成独立的三部分训练集(train set),验证集(validation set ) 和测试集(test set)。其中训练集用来估计模型,验证集用来调超参数,测试集用来测试模型准确度。
常见的机器学习算法
可以去sklearn官网查询。
有监督机器学习和无监督机器学习
- 有监督机器学习:我们要教会计算机做某些事情。我们给算法一个数据集,其中包含了正确答案,算法的目的就是给出更多的正确答案。
- 例子:分类
- 无监督机器学习:让计算机自己去学做某些事情。我们给算法一个数据集,但是不给他正确答案,而让计算机自己去学习。
- 例子:聚类