什么是数据挖掘?
数据挖掘任务:预测+描述性的
图:
监督对应预测性的;描述性的对应非监督
分类--预测;聚类--描述;关联规则--描述;序列模式发现--跟关联规则很像--描述;回归--预测;奇异值检测--描述,预测。
分类:
预测,所以训练集(+验证集)+测试集
验证集:实验室环境下的测试集。
聚类:
和分类最大是区别,没有分类标签。
相似度度量,距离(欧氏距离等)
数据挖掘任务:预测+描述性的
图:
监督对应预测性的;描述性的对应非监督
分类--预测;聚类--描述;关联规则--描述;序列模式发现--跟关联规则很像--描述;回归--预测;奇异值检测--描述,预测。
预测,所以训练集(+验证集)+测试集
验证集:实验室环境下的测试集。
和分类最大是区别,没有分类标签。
相似度度量,距离(欧氏距离等)