Pyspark
数据分析-模型相关 代码汇总
JerryFoo
这个作者很懒,什么都没留下…
展开
-
Pyspark一个完整建模流程Demo
spark树模型Demo原创 2023-05-14 17:21:15 · 336 阅读 · 0 评论 -
特征加工方法之RFM
RFM模型是指根据最近购买时间(Recency)、购买频率(Frequency)和购买金额(Monetary)等指标对顾客进行分类的一种营销分析模型。RFM群体为"333":最近购买较旧且购买频率和金额都不高的顾客,需要加强促销、提供个性化推荐等手段来留住这部分客户。RFM群体为"311":最近购买虽然不太新,但购买频率和金额都很高的顾客,应该推送商品组合或打包促销等奖励。RFM群体为"111":最近购买、购买频率和购买金额都很高的顾客,应该推送高价值商品或优惠券等奖励。原创 2023-05-14 17:07:52 · 105 阅读 · 0 评论 -
Pyspark 时间窗口函数
Pyspark提供了多种时间窗口函数,常用的有滑动窗口函数以及窗口聚合函数。以下是一个滑动时间窗口函数的实现示例:该函数的作用是,对每个用户的小时订单数进行滑动窗口求和。滑动窗口的大小为1小时,每次滑动1小时。这里使用了类进行窗口定义,并使用函数对窗口内的进行求和,结果存储在列中。原创 2023-05-12 19:18:32 · 285 阅读 · 1 评论