总算可以踏踏实实的学习机器学习了。
注:本系列内容属于机器学习入门,是作者在跟着慕课视频学习的一些总结性笔记,偏向于算法的原理以及技术实现,只包含基础的机器学习算法,不涵盖神经网络和深度学习,且不包括真实世界数据。
技术栈:Python3、scikit-learn、numpy、matplotlib
数学要求:本科高数、线代、概率论及格
机器学习基础概念:
数据:
数据集:数据整体。
样本:每一个种类的所有数据(特征)
特征:样本的某个特定属性
数据的种类:一般用0、1、2表示
大写字母X:数据矩阵
小写y:标记,(一般小写表示向量,大写表示矩阵)
向量:行向量(样本行)、列向量(特征列),其中以列向量较多
特征空间:根据特征画出的散点图,分类本质任务就是在特征空间切分
抽象特征:如图像,每一个像素点都是特征
机器学习的基本任务
分类任务:二分类(如判断是猫还是狗)、多分类(如手写识别、数字识别、图像识别、围棋,多分类任务可转化为二分类)、多标签分类(图片中的物体种类划分)。
回归任务:
结果是一个连续数字的数值,而非类别,比如预测学生成绩。
一些情况下,回归任务可简化成分类任务,如预测学生成绩的评级(A、B等)
现在可以引入机器学习的概念图:
模型:可理解为函数,机器学习主要就是建立模型。