1.常用算法:分类与预测,聚类
2.分类与预测
>>回归分析:确定预测属性(数值型)与其他变量间相互依赖的定量关系最常用的统计学方法。包括线性回归、非线性回归、逻辑回归、岭回归、主成分回归、偏最小二乘法回归等
>>决策树:采用自顶向下的递归方式,在内部节点进行属性值的比较,并根据不同的属性值从该节点向下分支,最终得到的叶节点是学习划分的类。
>>人工神经网络:是一种模仿大脑神经网络结构和功能而建立的信息处理系统,表示神经网络的输入与输出变量之间关系的模型
>>贝叶斯网络:又称信度网络,是Bayes方法的扩展,是目前不确定知识表达和推理领域最有效的理论模型之一
>>支持向量机:是一种通过某种非线性映射,把低维的非线性可分转化为高维的线性可分,在高维空间进行线性分析的算法
3.聚类
聚类:没有给定划分类别的情况下,根据数据相似度进行分组,建立在无类标记的数据上,非监督学习算法。
>>划分(分裂)方法:K-Means(K-平均)、K-MEDOIDS(K-中心法)、CLARANS(基于选择的算法)
>>层次分析法:BIRCH(平衡迭代规约和聚类)、CURE(代表点聚类)、CHAMELEON(动态模型)
>>基于密度的方法:DBSCAN(基于高密度连接区域)、DENCLUE(密度分布函数)、OPTICS(对象排序识别)
>>基于网格的方法:STING(统计信息网络)、CLIOUE(聚类高维空间)、WAVE-CLUSTER(小波变换)
>>基于模型的方法:统计学方法、神经网络方法