啦啦啦啦啦我又嚟啦~
今日讲下数据挖掘常见嘅技术以及应用,并不全面,大家求其睇下就好啦哈哈哈。
数据挖掘技术,在实际的应用中,主要就体现在4个方面:分类与回归,聚类,关联规则和时序模式。
分类与回归
建模原理:
分类(classification)
指的是将数据映射到预先定义好的群组或类,所以,通常分类也被称为有监督的学习。
分类算法要求基于数据属性值来定义类别,通常通过已知所属类别的数据的特征来描述类别。(贼拗口。。。)分类就是构造一个分类模型,通常分为2步:
模型创建:通过对训练数据集的学习来建立分类模型。
模型使用:使用分类模型对测试数据和新的数据进行分类。
回归(regression)
指的是用属性的历史数据预测未来趋势。
回归是假设一些已知类型的函数(如线性函数ÿ