人工智能
xiaodaokuailai
博客已搬家 欢迎访问,相互学习
展开
-
【人工智能】数据挖掘领域的十大经典算法
来自:csdn博客 数据挖掘十大经典算法国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART.不仅仅转载 2013-03-13 11:05:12 · 13032 阅读 · 0 评论 -
【人工智能】算法--理解贝叶斯分类器
什么是贝叶斯分类器: 他就是一个公式,在计算机领域称作是一个算法,该公式为:P(A|B)=P(B|A)*P(A)/P(B) 通过p(B|A)(先验概率)、p(A)、p(B)来计算p(A|B)的过程。 但是,他还是和公式有一个区别就是他还要完成比较的任务从而选出一个最优的。 官方解释: 贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出原创 2011-11-30 16:04:16 · 2020 阅读 · 0 评论 -
【人工智能】软件使用--weka如何处理大数据量
来自ITEYE:150M的训练集用WEKA做起来应该比较困难有这么几个办法: 1 增加内存。 其实WEKA不光可以用物理内存,还可以占用虚拟内存。把JAVA的可用内存设置成2G的话,如果机器的物理内存只有1G,操作系统是会在需要时自动在硬盘上划分一块出来作为虚拟内存的。不过这时候一般会处理得比较慢,因此不推荐这个方法。 2 抽样。从训练集中随机抽取一部分数据来作训练。在二分类的转载 2011-12-06 13:37:42 · 5387 阅读 · 2 评论 -
【人工智能】多示例学习定义
在多示例学习技术中,每一副图像被看做是一个包,把图像分割成多个区域,每一个区域被看成是一个示例,就是多示例学习中的示例。原创 2012-03-11 16:06:27 · 1461 阅读 · 0 评论 -
【人工智能】软件使用--weka如何进行数据预测
来自:沧海一粟的BLOG1、注意待预测数据集和训练用数据集各个属性的设置必须是一致的。即使你没有待预测数据集的Class属性的值,你也要添加这个属性,可以将该属性在各实例上的值均设成缺失值。比如你可以将欲预测的类别设为?即缺失值。2、在“Test Opion”中选择“Supplied test set”,并且“Set”成你要应用模型的数据集。3、右键点击“Res原创 2011-12-02 23:24:50 · 3450 阅读 · 0 评论 -
【人工智能】软件使用--weka数据类型的转换
第2001列是类标识,他是一个代号,我用整数表示,但是weka默认给我弄成了小数解决方法:在arff文件中@attribute 999 numeric@attribute 1000 numeric%%@attribute 2001 numeric将这一行改成下面,用选择的形式,先把可能的值列出来@attribute 2001 {1,2,3,4,5,6,7,8,9,10,11。。原创 2011-12-07 22:53:39 · 5169 阅读 · 1 评论 -
【人工智能】软件使用--Weka怎么设定类别
原创 2011-12-05 17:33:25 · 976 阅读 · 0 评论 -
【人工智能】软件使用--Weka如何调整JVM的内存大小
如果我们在使用WEKA的过程中,在导入csv文件时出现了JVM堆大小不够的问题,我们就需要调整JVM的参数,将内存扩充到至少512M,调整方法如下:在WEKA的安装目录下(如C:\Program Files\Weka-3-5)找到RunWeka.ini文件,打开此文件,将此文件后面的maxheap=128m修改为maxheap=512m,然后保存即可。原创 2011-11-30 18:52:05 · 3222 阅读 · 0 评论 -
【人工智能】算法--Precision/Recall和ROC曲线原理以及Matlab源码
查准率和查全率是信息检索效率评价的两个定量指标,不仅可以用来评价每次检索的准确性和全面性,也是在信息检索系统评价中衡量系统检索性能的重要方面。查准率(Precision ratio,简称为P),是指检出的相关文献数占检出文献总数的百分比。查准率反映检索准确性,其补数就是误检率。查全率(Recall ratio,简称为R),是指检出的相关文献数占系统中相关文献总数的百分比。查全率反映转载 2011-09-12 20:31:27 · 8513 阅读 · 0 评论