实时推荐
商品标签分词实时推荐
九八年的尾巴
一个愿意分享和倾听的年轻人
展开
-
实时推荐-3商品标签训练模型
package com.tuijian import org.apache.spark.mllib.feature.Word2Vec import org.apache.spark.sql.{SaveMode, SparkSession} import org.jblas.DoubleMatrix object HandleGood { /*** * 每件商品和其它商品之间的差距(两个向量之间的余弦度数) * 取出前10件商品 * @param args */原创 2020-11-04 11:10:02 · 253 阅读 · 0 评论 -
实时推荐-2数据中文分词
思路 效果 当用户点击某件商品,退出后发现下面都是相关商品 面临的问题 1.用户的随意性(今天点开了A,明天点开了B) 2.历史性(比如购面的是一件T恤,现在需要可能以后就不需要了) 3.实时性(当获得商品的速度应该是非常的快的,不能像离线运算计算结果需要好多秒,必须要求速度!) 思路 针对问题提供解决方案 1.计算所有商品的相似度,并存入数据库(主要是提供备用的选择项) 1-1:(提前存入商品标签)需要通过商品名称得出向量,根据向量判断之间的相似度,每一件商原创 2020-10-28 11:44:54 · 100 阅读 · 0 评论 -
实时推荐-1发送实时数据
因为需要实时数据量,创建一个自动发送数据的工具类 1.创建StreamingData1 package com.mllib import java.io.PrintWriter import java.net.ServerSocket import breeze.linalg.DenseVector import scala.util.Random object StreamingData1 { def main(args: Array[String]): Unit = { //原创 2020-10-28 11:30:30 · 173 阅读 · 0 评论