数据挖掘观察

机器学习,数据挖掘,搜索,大规模数据的并行处理。

原创  数据挖掘分类算法的比较 收藏

数据挖掘新手常问的一个问题是,这么多算法里面该选用哪一个?在没有更多背景信息给出时,如果追求预测的准确程度,一般用支持向量机(SVM),如果要求模型可以解释,一般用决策树。使用SVM的时候选择高斯核(即RBF kernel),同时要用交叉验证(cross validation)选择合适的模型参数。

下面的表格是对常用分类算法的一个比较,来自一篇文章
Kotsiantis, S. B.
Supervised Machine Learning: A Review of Classification Techniques
Informatica, 2007, 31, 249-268

比较1 

接下来这个表格的结论类似,它来自经典名著
Hastie, T.; Tibshirani, R. & Friedman, J.
The Elements of Statistical Learning, Second Edition
Springer, 2009

比较2

另外还有篇文章也可以作参考
Caruana, R. & Niculescu-Mizil, A.
An Empirical Comparison of Supervised Learning Algorithms
Proceedings of the 23rd International Conference on Machine Learning, 2006, 161-168

发表于 @ 2009年03月05日 22:14:00 | 评论( loading... ) | 编辑| 举报| 收藏

旧一篇:数据挖掘与人权 | 新一篇:自动化的人肉搜索引擎即将出现?

  • 发表评论
  • 评论内容:
  •  
Copyright © C6H5NO2
Powered by CSDN Blog