机器学习
定义:Field of study taht gives computers ability to learn without being explicitly programmed.即在没有基于计算机明确编程程序情况下,培养机器自主学习能力的一个研究领域。
分类:Supervised learning监督学习
Unsupervised learning 无监督学习
Supervised learning监督学习
需要给予计算机输入和输出去训练模型,在训练过程中,计算机会采取结果导向为我们所输入的结果进行标签化处理,从而为训练模型找出方向
回归算法Regression
对于回归算法,我的理解既是给予计算机输入x和输出y去训练出一个回归函数模型,就是去训练出数学中的映射关系的过程,这样我再给出一个全新的没有见过的输入值时,能够输出一个根据映射关系得到的预测值y’,当然这个输入不一定局限于数,输出也是。
分类算法Classfication
分类算法顾名思义就是基于计算机输入输出结果,让他根据输入输出进行训练,选来出来的模型能够判断不同的分类,例如给计算机100张图片以及告诉计算机什么样的是狗,什么样的是猫等等进行训练,计算机会根据训练的模型进行判断和特征提取,分别算出每一个类别的得分,进而判断分类。
Unspervised learning无监督学习
相对于监督学习,就是利用无标签的数据来学习建立数据之间的联系和特征。
聚类算法 Clustering
举个例子,比如我要研究一个陌生人是一个什么样的人,我需要看他的朋友圈子和谁关系比较近,和谁关系比较密切,当然我需要知道他周围人的性格特征,以此来推测,这个陌生对象的性格特征。但是应该采取什么样的距离,什么样的研究方法和算法,会衍生出不同的算法
降维 Dimensionality reduction
简单来说,就是简炼出比较有特征的少部分数据来代表整体,这个过程要尽可能减少损失,有时候特征比较多,对于我们解决问题却并不是所有的都有用,所以要对数据进行降维处理,就比如上面的问题,我们要研究这个陌生人的性格特征,那体重和身高相对于其他生活习惯等对我们研究目标的重要性就相对低一些。