机器学习
基本概念
- 从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。
- 但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。
机器学习方法是计算机利用已有的数据,得出了某种模型,并利用此模型来预测未来的一种方法。
- 训练: 对历史数据通过算法进行处理的过程
- 模型: 对历史数据通过算法进行处理的结果,处理的结果可以用来对新数据进行预测
- 预测: 对新数据的预测过程
- 总结: 训练和预测是机器学习的两个过程,模型是过程的中间输出结果,训练产生模型,模型指导预测
机器学习的处理过程不是因果的逻辑,而是通过归纳思想得出的相关性结论。
3.(机器学习就是通过特征向量构建统计模型,从而找出事务之间的相关性)
相关文章
- 特征向量(有关特征的向量)
- 密集向量和稀疏向量的区别
去不去掉0的区别
例如:向量(1.0,0.0,1.0,3.0)
密集向量:[1.0,0.0,1.0,3.0],不去0
稀疏向量:
第一种方法:(4,[0,2,3],[1.0,1.0,3.0])
第二种方法:(4,(0,1.0),(2,1.0),(3,3.0))
监督学习和非监督学习:
-
监督学习算法和无监督学习算法
首先理解两个基本概念:特征值和目标值(标签)
特征值: 指数据的特征,对于每个样本,通常具有一些"属性(特征)"
目标值(标签): 描述了该条样本数据所属的目标或类型 -
监督学习
监督学习是从给定的训练数据集中训练出一个模型,当新的数据到来时,可以根据模型预测结果,训练的数据集中包括输入(特征)和输出(标签|目标),训练集中的目标是人事先标注的
- 非监督学习
非监督学习过程中,只提供特征不提供标签,使其自己总结归纳。所以非监督学习又称为归纳行学习(Clustering),是指将数据集合分成由类似的对象组成的多个簇(或组)的过程。人只提供每个样本的特征,使用这些数据,通过算法让机器去学习,进行自我归纳,以达到同组内的事物特征非常接近,不同组的事物特征相距很远的结果。
总结: 通过数据的特征值从来来预测该数据属于哪个样本,监督学习知道这个样本是什么(有标签),无监督学习不知道这个样本是什么(没有标签)