机器学习review
Paper:Machine Learning: A Review of Learning Types
这是一篇关于机器学习的综述,里面简述了各种现有的机器学习技术。
1 主要的方法:监督、无监督、强化
1.1 监督学习
数据格式:特征 + 标签
学习目标:到从输入到输出的映射函数
根据输出变量划分,监督学习又可以分为分类和回归
分类:输出结果是离散的、可列的,如水果种类、手写字体识别。
回归:输出结果是连续的,如价格、温度-气压曲线
1.2 无监督学习
数据格式:特征
目标:尝试根据输入的数据建立模型,发现数据的潜在特性
无监督的代表是聚类——一种挖掘数据内部结构的技术。
举个栗子:我有10个样本,要把它们分成A、B、C共3类(集群);
如下图,每个类内部的样本其相似性较大,类之间相似性较小。
相似性度量可用空间距离、欧氏距离,度量方法不同会产生不同的聚类结果。