机器学习是什么
机器学习是一门从数据中研究算法的科学学科,尝试让计算机模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。是根据已有的数据,进行算法选择,并基于算法和数据构建模型,最终实现对未知进行预测。
监督学习和无监督学习
监督学习和非监督学习的差别就是训练集目标是否有人为标注。监督学习中的每一个样本都已知正确结果。无监督学习中给定一个未知结构的数据集,尝试找出数据的结构和规律。
监督学习
提供输入数据和其对应的标签数据,搭建一个模型,模型经过训练后准确的找到输入数据和标签数据之间的最优映射关系,从而对新的未标记数据进行预测或分类。主要有以下两类问题。
回归问题(Regression):预测连续值输出。基于已知答案的样本构成的训练集,建立起估计自变量与因变量之间关系的模型,基于该模型对新的观测样本的输出进行预测,预测输出为连续值。
分类问题(Classification):预测离散值输出。基于已知类别标签的样本构成的训练集,建立预测模型,对新的观测样本,预测相应的输出。预测结果为事先指定的两个或多个类别中的某一个,或者来自数目有限的离散值之一。
监督学习主要包括:线性回归、逻辑回归、决策树、随机森林、支持向量机、朴素贝叶斯、k近邻算法。
无监督学习
训练数据只包含输入样本,没有相应的标签或目标。主要有以下三类问题。
关联分析:通过对数据集当中同时发生的事件的概率进行分析,从而挖掘它们之间是否存在一定的关联关系。
聚类问题:将相似的样本划分为一个簇(cluster)。与监督学习中的分类问题不同,聚类问题预先并不知道类别标签,训练数据中也没有类别的标签。
维度约减:即降维,在减少数据的维度同时保证不丢失有意义的信息。利用特征提取方法和特征选择方法,可以达到降维的效果。主要方法有主成分分析(PCA)等
无监督学习主要包括:聚类、主成分分析(PCA)、关联规则挖掘。
半监督学习
半监督学习是结合了监督学习和非监督学习的特点,利用少量有标签的样本,和大量没有标签的样本对进行训练。
强化学习
通过学习可以获得最大回报的行为,强化学习可以让个体根据自己当前的状态,来决定下一步采取的动作,通过反复试验来学习最优的动作。强化学习在机器人学中被广泛应用,比如在与障碍物碰撞后,机器人通过传感收到负面的反馈从而学会去避免更多的碰撞。