目录
1、简述有监督学习和无监督学习。
1.1 监督学习:
机器使用“标记好”的训练数据进行训练,并基于该数据,机器预测输出。标记的数据意味着一些输入数据已经用正确的输出标记。也就是提供给机器的训练数据充当监督者,教导机器正确预测输出。
1.2 无监督学习:
无监督学习是一种机器学习技术,其中模型不使用训练数据集进行监督。相反,模型本身会从给定数据中找到隐藏的模式和见解。它可以比作在学习新事物时发生在人脑中的学习。
2、简述训练集、测试集。
2.1 训练集:
训练集是机器学习模型用于训练和学习的数据集。通常情况下,训练集时原始数据集的一部分,用于训练模型的参数。模型通过训练集来学习数据的特征,产生一个模型,以便在之后的预测中使用。
2.2 测试集:
测试集时用于评估模型最终性能的数据集,它通常从原始数据集中划分出来的,与训练集和验证集互不重叠,测试集的作用是评估模型从未见过的数据上的性能,并判断模型是否足够准确。
3、简述回归和分类任务的异同。
3.1 不同点:
3.1.1 输出不同:
①分类问题输出的是物体所属的类别,回归问题输出的是物体的值。
②分类问题输出的值是离散的,回归问题输出的值是连续的。
③分类问题输出的值是定性的,回归问题输出的值是定量的。
3.1.2 目的不同:
①分类的目的是为了寻找决策边界,即分类算法得到是一个决策面,用于对数据集中的数据进行分类。回归的母的是为了找到最优拟合,通过回归算法得到是一个最优拟合线,这个线条可以最好的接近数据集中的各个点。
3.1.3 结果不同:
①分类的结果没有逼近,对就是对,错就是错,什么类别就是什么类别,最终结果只有一个。回归是对真实值的一种逼近预测,值不确定,当预测值与真实值相近时,误差较小时,认为这是一个好的回归。
3.2 相同点:
3.2.1 本质相同:
①分类模型可将回归模型的输出离散化,回归模型也可将分类模型的输出连续化。
②两者都是对输入做出预测,并且都是监督学习。根据特征,分析输入的内容,判断它的类别或者预测其值。
4、基础概念
4.1 机器学习常用的库是:Sklearn
4.2 通过机器学习判断未剖开的西瓜是好瓜还是坏瓜的步骤大致可归纳为(13254)。
(1)收集历史数据:很多已经剖开了的西瓜。
(2)总结学习。
(3)探究西瓜好坏各自的特点,之间的差别。
(4)判断未剖开的西瓜是好瓜还是坏瓜。
(5)根据历史数据总结学习,建立模型。
4.3 深度学习是机器学习方法中的一类方法。