美国 2006 年机器学习和知识发现年会数据挖掘使用率较高算法排名

在美国 2006 年机器学习和知识发现年会,数据挖掘(Data Mining)哪些算法使用率较高?现场投票结果可以给我们一点线索。数据挖掘有十大经典算法为:C4.5,K-Means,SVM,Apriori,EM,PageRank,AdaBoost,KNN,NB 和 CART。

表 美国2006年机器学习和知识发现年会数据挖掘使用率较高算法排名

算法

票数

百分率

典型算法

决策树 Decision Tree12762.6%C4.5、CART
回归 Regression10451.2% 
聚类算法 Clustering 10250.2%K-Means、BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)
描述性统计分析 Statistics(descriptive)9446.3% 
可视技术 Visualization6632.5% 
关联法则 Association Rules5326.1%GSP(Generalized Sequential Pattern)、Apriori
时序 Sequence/Time series Analysis3517.2% 
神经网络 Neural Nets3517.2% 
支持向量机 Support Vector Machine(SVM) 3215.8% 
贝叶斯 Bayesian3215.8%NB(Naive Bayesian)
Boosting3014.8%AdaBoost
近邻 Nearest Neighbours2612.8%K Nearest Neighbours(KNN)
模型合成 Hybrid Methods2411.8% 
其他 Other 2311.3% 
遗传算法 Genetic Algorithms2311.3% 
Bagging2210.8% 
 共203人投票  

由于是自愿投票,对投票人的背景、行业和领域没有任何限制,因此本结果在代表性方面当然不够完整。但是,我们还是可以通过这个调查粗略了解目前数据挖掘算法的态势。总的来说,用于分类和预测的决策树和回归算法,以及用于描述聚类分析占主导地位。

决策树和逻辑回归从技术角度看,都不是太高深的算法。但是能得到普遍应用,说明他们在解决不同行业,不同领域中,数据挖掘问题上都有很好的功效,说明企业管理人员对这些算法接受程度较好,也反映了企业拥有的数据并不是复杂到一定要用高深的算法可能应对。此外不可忽视的是,这些算法在运算速度上都有一定优势。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值