最近由于项目要求,从零开始自学机器学习,使用语言是python2.7。
机器学习分类:监督学习,无监督学习,强化学习
监督学习:对事物未知表现的预测,包括分类问题和回归问题。
(1)分类:指给一个新的模式,根据训练模型推断它所对应的类别是多少,是一种定性输出,也叫离散变量预测。
(2)回归:指给一个新的模式,根据训练模型推断他的对应的输出值是多少,是一种定量输出,也叫连续变量预测。
举例:预测明天是阴、晴还是雨,就是一个分类任务;预测明天的气温是多少度,这是一个回归任务。
常用分类模型有:线性分类器,支持向量机,朴素贝叶斯,K近邻,集成模型。
常用回归模型有:线性回归器,支持向量机(回归),K近邻(回归),集成模型(回归)
无监督学习:对事物本身特性的分析,与监督学习不同,不需要对数据进行标记,无监督学习常用技术包括数据降维与数据聚类等。
(1)数据聚类:按照某个特定标准把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。
(2)数据降维:直观地好处是维度降低了,便于计算和可视化,其更深层次的意义在于有效信息的提取综合及无用信息的摈弃。
举例:一个聚类分析的实例通过大量移动设备用户的位置信息,为某连锁餐饮机构提供新店选址。再如在做人脸识别的时候,首要的就是将人脸图像,从高维到低维投影是数据可视化,可分析。
常用聚类模型有:K均值算法,层次聚类,基于密度的聚类等。
常用降维模型有:PCA,Isomap,LLE等。
强化学习:大名鼎鼎的AlphaGO就是强化学习的一个成功案例。强化学习的本质是解决 decision making 问题,即自动进行决策,并且可以做连续决策。