Mahout 数据挖掘
文章平均质量分 90
张大彪
十年磨一剑
展开
-
常用数据挖掘算法
本文对数据挖掘的基础理论,做个框架性的总结概要,罗列一些通用的数据挖掘的算法和思路,对于自己来讲是一个回顾,同时也便于自己以后查阅。频繁模式挖掘,关系挖掘,以及相互关系挖掘所谓频繁模式挖掘,指的是比如在商品交易数据库记录中,找出一起出现的商品集合,这些商品集合出现的频率要高于一个阈值,这些经常出现的商品集合称之为频繁模式。频繁模式的思路很简单,首先统计出每个单个商品出现的次数,这就构成...转载 2012-09-07 10:24:38 · 22987 阅读 · 0 评论 -
hadoop下mahout kmeans算法研究(2)
KMeans算法和简单命令使用(2) 接上篇:hadoop下mahout-kmeans算法研究(1) 如果对本文档有任何建议或者认为有错误的地方欢迎联系本人大家一起进步啊红色的字体:重点和注意事项蓝色的字体:出现的问题和解决/未解决绿色的字体:个人建议数据输入格式测试数据 每个数据和数据之间用空格分开,数据都是double型的 ...原创 2012-08-31 21:57:22 · 9553 阅读 · 4 评论 -
hadoop下mahout kmeans算法研究(1)
KMeans算法和简单命令使用(1) 如果对本文档有任何建议或者认为有错误的地方欢迎联系本人大家一起进步啊 红色的字体:重点和注意事项蓝色的字体:出现的问题和解决/未解决绿色的字体:个人建议 Tips:在要输入路径的命令使用时最好在路径的前后都加”/”分开,这样不容易出错如:hadoop fs -put /root/input/kmeans.data/原创 2012-08-27 22:15:24 · 7047 阅读 · 2 评论