摘要
Instance, example, feature, label, supervised learning,unsupervised learning, classification, regression, clustering,prediction, training set, validation set, test set, K-fold cross validation, classification error, loss function, overfitting, underfitting, regularization.
Def
experience E,task T,performance measure P
如果一个计算机程序在某个任务T的性能衡量指标P上,随着经验E的积累而提高,
则可以说它在关于任务T和衡量指标P的经验E中学习。
ML分类
无监督学习通过无标签数据训练模型。反之。
Unsupervised learning无监督学习
Learning a model from** unlabeled data.**
一些前置知识
feature vector:特征向量,维度代表其个数。如果见到x⊂ ℝ𝑑,那么x是特征向量,ℝ𝑑是维度为d的特征向量空间。
训练集(training data): examples "x"
用于机器学习模型训练的数据集,包含多个训练样本,在此处,每一个x是一个训练样本
{]~J65Y%S[C}5S4AN.png?auth_key=1677319813-fxBQsuwBASwze9kPFXFxoR-0-2e6ae4a2f7c99676e6cb6e75ffcced30)
特征向量x1, … , xn是数据集中的每个样本;X是样本的取值范围(向量空间);Rd表示实数空间中的d维向量。
Clustering聚类/segmentation分割
两者相似,具体实现不同,只需理解如下:
我们希望将训练集分成不同的集合,其中每个集合包含相似的数据点。
函数f将训练数据集中的每个数据点x映射到其所属或集合。
所以聚类/分割是无监督学习,因为训练数据集中的样本没有预先定义的标签,模型需要自行发现数据中的结构和模式。
Supervised learning监督学习
Learning a model from labeled data.带标签的数据
通过有标签数据训练模型。
训练集(training data): examples "x" with labels "y"