Python机器学习入门
ps:想了解机器学习发展历史、使命、面临的问题这些的可以看百度BOSS李彦宏新书《智能革命》,挺通俗易懂的。
机器学习的目标就是通过若干示例让机器学会完成人物,例如电子邮件分类。
工作流程绝大部分的时间花在:
1)读取和清洗数据
2)探索和理解输入数据
3)分析如何最好地将数据呈现给学习算法
4)选择正确的模型和学习算法
5)正确地评估性能
通常在训练前要对部分数据进行提炼,一个简单算法在提炼后数据上的表现,甚至能够超过一个非常复杂的算法在原始数据上的结果。提炼数据的流程叫做特征工程--feature engineering。
可以看到算法只是五个环节中的一个,1)、2)、3)都和数据有关。
推荐的问答网站:http://metaoptimize.com/qa 专注机器学习主题