![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Mahout
庸医2048
edgex foundry开发工程师
展开
-
Mahout第一篇
最近公司上了一项项目,有大量的数据,需要进行推荐、分类、聚类等功能,进行相应的学习。所以最近看了一本Mahout实战这本书。 下面是我的学习总结:我主要研究的是分类这个功能块,以后会全面学习。 分类定义:是使用特定的信息 从一个预定义的潜在回应列表中做出单一选择的过程。(就像一个单选题一样,从四个答案中选择一个最正确的答案。) 分类项目工作流程分三个阶段: 1》训练模型原创 2016-11-09 19:22:39 · 347 阅读 · 0 评论 -
Mahout分类中在“文本编码器”中“body”是啥意思
// 文本编码器 FeatureVectorEncoder textEncoder = new StaticWordValueEncoder("body"); textEncoder.setProbes(2); textEncoder.setTraceDictionary(traceDictionary); 其实这个“body”就是给这个编码器起原创 2016-11-10 09:36:59 · 405 阅读 · 0 评论 -
Mahout配置学习算法
配置学习算法:OnlineLogisticRegression传入了三个参数(目标向量的个数,特征向量的大小以及正则化项)this.learningAlgorithm = new OnlineLogisticRegression(dictionary.size(), FEATURES, new L1()) .alpha(1) // 学习率原创 2016-11-10 14:38:00 · 360 阅读 · 0 评论