机器学习概念
如果一个程序,在执行某个任务的过程中,能够利用现有的经验数据不断的完善与提高完成既定任务的性能,这个程序就是具有学习能力的。
三个特点:经验、任务、性能
一、经验
我们习惯上把已知数据看做经验:在客观世界中所有的信息都可以进行数据量化,也就可以看做经验数据。
数据的向量化:我们在取描述一个客观事物的时候一般会用一个向量来描述,在这个向量中每一个值就代表了该事物的一个特征,这个向量被称为特征向量。
二、任务
利用现有的经验数据,根据特定的算法模型,对数据进行归纳总结进而对未知数据进行预测,或者对已知特征进行分析。根据任务的数据特点和算法特点,可以把任务分为监督学习和无监督学习
监督学习
监督学习的主要任务:有已知数据来预测未知数据
数据特点:由特征和标签两部分构成
根据标签的不同类型可以将监督学习分为:分类问题和回归问题
分类问题:标签就是数据预测的类别,它是离散的、没有相互关联的、数量是明确的
回归问题:标签是预测的具体数值,它是连续的、相互关联的、不明确的
监督学习的算法
k-近邻
线性回归
贝叶斯
决策树
支持向量机
集成学习
无监督学习
无监督学习主要任务:对客观事物的本身特征进行分析
数据特点:只有特征没有标签
技术手段:聚类,特征降维,分词法等
聚类:把特征相近的样本归为一类
三、性能
性能评测:
分类问题:准确率、精确率、召回率等
回归问题:均方误差、平均绝对误差等
深度学习
TensorFlow基础
全连接神经网络、卷积神经网络、循环神经网络(NLP)