标签:标签是要预测的事物,即可以简单理解为线性回归中的y变量。标签也可以是小麦未来的价格,图片显示的动物品种。
特征:特征是输入变量,即可以简单理解为线性回归中的x变量。简单的模型可能使用单个特征(x),较为复杂的机器学习模型会有上百万个特征(x1,x2,···,xn)。在“垃圾邮件人工智能检测器中”特征可能包括:电子邮件文本中的字词,发件人的地址,发送电子邮件的时段,邮件的大小。
样本:样本可分为有标签样本和无标签样本,有标签样本是指包含“特征x”和“标签y”,无标签样本是指只包含“特征x”,不包含“标签y”。有标签样本可用来作为模型的训练集,而无标签样本是模型的测试集。
模型:模型定义了“特征”和“标签”之间的关系,例如,在垃圾邮件检测模型会将某些特征与“垃圾邮件”联系起来。
学习笔记内容源自于于床长人工智能教程:https://captainbed.vip