数据挖掘
文章平均质量分 61
lifuxin1125
这个作者很懒,什么都没留下…
展开
-
数学符号
1 Α α alpha a:lf 阿尔法 角度;系数2 Β β beta bet 贝塔 磁通系数;角度;系数3 Γ γ gamma ga:m 伽马 电导系数(小写)4 Δ δ delta delt 德尔塔 变动;密度;屈光度5 Ε ε epsilon ep`silon 伊普西龙 对数之基数6 Ζ ζ zeta zat 截塔 系数;方位角;阻抗;相对粘度;原子序数7 Η η eta ei原创 2012-04-18 10:06:53 · 933 阅读 · 0 评论 -
数据挖掘领域的十大经典算法
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART.不仅仅是选中的十大算法,其实参加评选的18种算法,转载 2012-07-18 21:52:46 · 979 阅读 · 0 评论 -
分类和聚类的区别
分类(classification )是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。分类分析在数据挖掘中是一项比较重要的任务,目前在商业上应用最多。分类的目的是学会一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定类别中的某一个类中。 分类和回归都可用于预测,两者的目的都是从历史数据纪录中自动推转载 2012-03-05 13:03:13 · 1133 阅读 · 0 评论 -
weka关联的ARFF文件
weka中的arff数据文件1.ARFF(Attribute-Relation File Format)文件时一个ASCII文件,用于描述一组共享某些属性的实例。主要是两部分:Header information and Data information1>Relation information: 格式: @ralation 比如说:@RELATION ir翻译 2013-03-19 08:51:20 · 2077 阅读 · 0 评论 -
信息检索(IR)的评价指标介绍 - 准确率、召回率、F1、mAP、ROC、AUC
在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率,准确率也叫查准率,概念公式: 召回率(Recall) =转载 2013-04-07 23:51:43 · 783 阅读 · 0 评论 -
Java通过weka接口建立RF和SVM分类器
一、Instance 实例类该类是用于处理一个有序的权重实例典型的使用方法:import weka.core.converters.ConverterUtils.DataSource; ... // Read all the instances in the file (ARFF, CSV, XRFF, ...) DataSource source = new DataS原创 2013-03-18 23:12:41 · 5426 阅读 · 3 评论