机器学习,兴起于人工智能(AI),是计算机的新能力。
很多无法通过手工编程实现的程序,可以让计算机“自己去学”。
学习型算法已经使数据挖掘领域的研究取得了重要进展——访问推荐书和电影的网站,那么会有一些学习型算法来学习你经常会购买的书和电影的种类,从而给你提供个性化的推荐。
机器学习——不针对计算机直接编程的情况下,赋予计算机学习的能力。
对于一个计算机程序,给它一个任务T和一个性能测量方法P,如果在经验值E的影响
下,P对T的测量结果得到了改进,那么就说程序从E中学习。
常用工具:Matlab,Octave
可能会涉及凸优化理论(convex optimizaition),隐马尔科夫模型(hidden Markov model)[对时间序列进行建模的算法]
机器学习主要分为四个部分:
一、Supervised Learning(监督学习)
给算法提供了一组“标准答案”,希望通过学习“标准输入与输出”的联系,以尝试对我们的其他输入给我们提供更为标准的答案。
典型问题:回归问题(“回归”意味着我们需要测量的变量是连续的)
分类问题(要处理的变量是离散的)同时考虑多个输入变量和多个特征(向量)[SVM(无限维)]
PS:所谓“标准答案”,是指训练样本已经分好类
二、Learning Theory(学习理论)
让学习型算法尽量高效,但又要保证精度。(例如采样时样本的大小)
机器学习——一个非常强大的工具,学习理论的目的是将机器学习的理念,将机器学习的算法应用到解决实际问题中。
三、Unsupervised Learning(无监督学习)
典型问题:聚类问题。应用:计算机集群、社会网络分析,市场划分,独立组件分析(ICA算法)[解决鸡尾酒会的问题]
PS:训练样本未分类
四、Reinforcement Learning(强化学习)
用在你不需要进行一次决策的情形中
这个涉及到一个重要的概念:回报函数(reward function):定义需要找到一种方式,来定义你想要什么?如何定义一个好的行为与坏的行为,而我们的算法就是尽量使“好的行为”越多而“坏的行为”越来越少。