什么是机器学习
机器学习是一种让计算机利用数据而不是指令来进行各种工作的方法,主要使用归纳、综合而不是演绎。
它研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
demo:
机器识别图片结果为:“A person riding a motorcycle on a dirt road”
相关概念
数据集:数据的集合
训练集:用来进行训练,也就是产生模型或者算法的数据集
测试集:用来专门进行测试已经学习好的模型或者算法的数据集
样本:单条数据(可为训练样本或者测试样本)
特征(特征向量):属性的集合,通常用一个向量来表示,附属于一个实例
属性值:单个属性的值
标签(标记):实例类别的标记(通常为结果)
监督学习:训练集有类别标记
非监督学习:训练集无类别标记
半监督学习:有类别标记的训练集 + 无标记的训练集
分类:目标标记为类别型数据</