data set 数据集 sample set 样本集
attribute 属性
feature 特征 两者意思相同,都是数据集中可以提炼出来的一些特征值
training set 训练时使用的集合
groud truth 真相(并非假想值)
label 标签(好瓜坏瓜,也就是y的值,可能有0123)
discrete data 离散的值 适用于classification 分类问题
continuous data 连续的值 适用于regression 回归问题
testing data 测试集
supervised learning 带监督的机器学习,linear regression logistic regression
就是带right answer 的数据集
unsupervised learning 不带监督的机器学习clustering分类
就是不带right answer的数据集