spark
文章平均质量分 64
姜呆
这个作者很懒,什么都没留下…
展开
-
电影推荐系统Sparrow Recsys源码解读——FeatureEngineering部分
特征工程部分的代码。对电影数据进行特征处理。代码内容包含:对类别标签进行one-hot编码,以及multi-hot编码,以及数值特征的处理package com.wzhe.sparrowrecsys.offline.spark.featureengimport org.apache.log4j.{Level, Logger}import org.apache.spark.{SparkConf, sql}import org.apache.spark.ml.{Pipeline, Pipeli原创 2021-02-11 00:49:57 · 906 阅读 · 6 评论 -
电影推荐系统Sparrow Recsys源码解读——FeatureEngForRecModel部分
import org.apache.log4j.{Level, Logger}import org.apache.spark.SparkConfimport org.apache.spark.sql.expressions.{UserDefinedFunction, Window}import org.apache.spark.sql.functions.{format_number, _}import org.apache.spark.sql.types.{DecimalType, FloatTy原创 2021-02-11 00:43:24 · 1079 阅读 · 2 评论