- 博客(3)
- 资源 (2)
- 收藏
- 关注
原创 weka分类器-C4.5决策树
1. 算法概述 C4.5,是机器学习算法中的另一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法,是相对于ID3算法的改进,主要改进点有:1. 用信息增益率来选择属性。C4.5克服了ID3用信息增益选择属性时偏向选择取值多的属性的不足。2. 在树构造过程中进行剪枝。3. 对非离散数据也能处理。
2013-03-09 22:05:27 4968
原创 weka分类器-NaiveBayes
Weka中实现一个分类器比较重要的有一下3个方法:buildClassifier(Instances instances)double[] distributionForInstance(Instanceinstance)double classifyInstance(Instance instance) throwsException;其中后2个只要实现其中之一即可,因此我们在分
2013-03-08 17:04:35 6668
原创 weka源代码分析-总述
WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。Weka是一个开源的软件,阅读并理解其源代码可以帮助我们更好的理解算法的细节,同时也能够扩展其算法以获得更广泛的应用。但是现在公开的资料中对weka源代码分析的内容很少,所以本博客推出weka源代码分析系列,将针对weka中实现各种
2013-03-07 21:32:15 2066
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人