Spark
关于spark的笔记
宁君
大数据
展开
-
Spark协同过滤算法-酒店推荐
要基于用户的收藏和酒店的详情数据来构建一个推荐系统,我们可以使用协同过滤算法,这是推荐系统中常用的技术。协同过滤主要分为用户基于(User-Based)和项目基于(Item-Based)两种,这里我们可以使用Spark MLlib的ALS(交替最小二乘法)算法来实现用户收藏数据为user_favorite_data.csv结果为在上面的代码中,我们首先加载了酒店详情数据(虽然详情数据在这里可能不需要,但如果有其他用途,可以保留),然后加载了用户收藏数据。用户收藏数据被转换成了三列DataF原创 2024-04-18 09:48:07 · 551 阅读 · 0 评论 -
spark单机版安装
单机版安装,只需要jdk和spark, 不需要hadoop。原创 2024-03-31 23:09:28 · 592 阅读 · 0 评论 -
spark报错1
出现这个问题,一般是虚拟机上,没有固定IP, 每次电脑重启的时候, IP就变了。就是hosts文件绑定的ip地址和你当前的ip地址是不对的。原创 2024-03-31 21:20:52 · 639 阅读 · 0 评论