01 什么是机器学习? 首先对比人类学习,人类通过观察获得经验的积累(skill);机器学习是从数据(data)中学习获取技能。 人类学习 vs. 机器学习 这里所说的skill, 其实就是某一方面表现(performance measure)的增进。 那么何时考虑使用机器学习,通常需要满足以下三个前提: 存在有待学习的隐含模式(underlying pattern)。该模式无法/难以通过程序实现(no programmable definition)。该模式存在足够多的数据(data)。 02 The Learning Model 下面介绍机器学习的一般模型,以及一些专用术语。 图中涉及到一些概念: 目标函数f( target function, underlying pattern)训练数据D(data, training examples)假说(hypothesis)假说空间(hypothesis set)学习算法A(learning algorithm) 一言以蔽之,Machine Learning = A take D and H to get g。具体而言,使用机器学习算法A,利用数据D,在假说空间中寻找一个最佳的g,作为最终目标函数f的近似。 示例:是否给用户发信用卡 在此示例中,假说空间中,有三种假说。机器学习算法就是要寻找最好的g。 03 机器学习 vs. 数据挖掘 vs. 人工智能 vs. 统计学 转自:算法channel 阅读伙伴公众号更多精彩内容,点击 “ 阅读原文 ”