mllib
文章平均质量分 94
xiao_jun_0820
要自己每天都开心,不要烦恼
忘掉压力,天天好心情
展开
-
Recommending Firefox add-ons with Spark
转自http://robertovitillo.com/tag/recommender-system/recommender systemmachine learningmap-reducemozillarecommender systemscalasparktelemetryRecommending Firefox add-ons with SparkWe are cur转载 2015-07-21 15:04:14 · 1017 阅读 · 0 评论 -
spark mllib 中的tf-idf算法计算文档相似度
import org.apache.spark.mllib.feature.{HashingTF, IDF}import org.apache.spark.mllib.linalg.{SparseVector => SV}import org.apache.spark.{SparkConf, SparkContext}import scala.io.Source/** * Crea原创 2015-10-20 15:31:37 · 12056 阅读 · 0 评论 -
使用朴素贝叶斯算法,通过用户安装的APP列表来推测用户的性别
转自http://blog.csdn.net/cnweike/article/details/47167411目录(?)[+]从本质上来说,这是一个分类问题,类似于通过邮件内容来推测垃圾邮件,通过用户的相关信息来推测用户是否会拖欠贷款,而通过用户的APP安装列表来推测用户的性别也是一个类似的问题。对于贝叶斯算法来说,我们首先需要一个训练集数据,这个训练集转载 2016-03-16 18:17:46 · 2455 阅读 · 0 评论 -
图片降维处理
彩色图片一个像素是有RGB3色,就算用int保存的话,一个Int 4个字节,也要12个字节,需要转换成单色灰色,这样就只需要一个数字来表示颜色了,从而降低了维度,并节约了内存import java.awt.image.BufferedImageimport java.io.Fileimport javax.imageio.ImageIOimport org.apache.spark原创 2016-03-18 11:59:37 · 7670 阅读 · 0 评论