mahout
文章平均质量分 75
Nate_7090
这个作者很懒,什么都没留下…
展开
-
hadoop下mahout bayes(贝叶斯)算法研究(2)
接前面的hadoop下mahout-bayes(贝叶斯)算法研究(1) 9.输出数据含义分析与研究 这个混合矩阵的意思说明: 上述a到u分别是代表了有20类别,这就是我们之前给的20个输入文件转载 2015-03-10 20:25:21 · 453 阅读 · 0 评论 -
hadoop下mahout bayes(贝叶斯)算法研究(1)
1.算法简介 朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素,朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率哪个最大,就认为此待分类项属于哪个类别。 这二十个新闻组数据集合是收集大约20,000新闻组文档,均匀的分布在20个不同的集合。这20个新闻组集合采集最近流行的数据集合到文本程序中作为实验,根据机转载 2015-03-10 20:21:39 · 412 阅读 · 0 评论 -
Mahout安装与配置
Mahout是Hadoop的一种高级应用。运行Mahout需要提前安装好Hadoop。Hadoop的安装网上很多,并不复杂,这里不再讲述,接下来阐述怎么安装Mahout。 1:下载二进制解压安装。 到http://mahout.apache.org下载,我选择下载二进制包,直接解压及可。 hadoop@ubuntu:~$ tar -zxvf mahout-distribution-0.7转载 2015-03-13 11:15:54 · 401 阅读 · 0 评论