![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Spark ML
Last_xuan1
这个作者很懒,什么都没留下…
展开
-
pyspark mllib ALS 实践
数据集 https://tianchi.aliyun.com/dataset/dataDetail?dataId=56基于 ALS 的 LFM 算法进行候选集召回# 从用户行为日志数据集behavior_log 7亿 条数据中选取 100万 条import pandas as pdimport warningswarnings.filterwarnings("ignore")pat...原创 2020-02-04 14:44:32 · 612 阅读 · 0 评论 -
Spark Preprocessing&FE practice
最近因为要做推荐系统 ,为了熟悉 pyspark 的操作,并且熟悉一下处理日志数据 , 故尝试处理此数据集数据集介绍Ali_Display_Ad_Click是阿里巴巴提供的一个淘宝展示广告点击率预估数据集。 下载地址 https://tianchi.aliyun.com/dataset/dataDetail?dataId=56 ,数据名称说明属性...原创 2020-02-04 14:38:28 · 338 阅读 · 0 评论