我的项目
追风筝的少年-
Talk is cheap, Show me the code!
展开
-
基于Spark统计购物网站标签
文章目录1、项目描述2、数据描述3、实现1、项目描述目前,越来越多的商家驻扎于购物网站中,每天都有大量的用户在不同的商家购物,然后进行评价,如图1,图2,图3所示。评论越多,说明该商品越火热,商家知名度也越高。因此,统计海量用户对不用商品的评论,然后进行分析。商家根据分析结果做出调整,这可以影响大众的消费趋势和消费心理。 2、数据描述评价标签生成有很多方法:...原创 2019-03-17 16:23:44 · 492 阅读 · 0 评论 -
基于Flume+Kafka+HBase+Mapreduce的电信客服项目(下)
文章目录1、数据消费阶段2、数据分析阶段1、数据消费阶段2、数据分析阶段原创 2019-04-15 21:15:38 · 647 阅读 · 0 评论 -
基于MapRedue分析用户画像
文章目录1、项目描述1、项目描述1、项目描述1、项目描述1、项目描述1、项目描述原创 2019-04-03 15:54:03 · 270 阅读 · 0 评论 -
基于Flume+Kafka+HBase+Mapreduce的电信客服项目(上)
文章目录原创 2019-04-14 19:42:04 · 1416 阅读 · 0 评论 -
基于Spark实现电影点评系统用户行为分析—DataFrame篇(二)
文章目录1、介绍2、业务统计3、代码实现1、介绍Spark SQL有三种不同实现方式:(1)使用DataFrame与RDD结合的方式。(2)纯粹使用DataFrame的方式。(3)使用DataSet的方式。本文仅介绍第二种方式,其他方式可以参考源码(底部)。DataFrameAPI是从Spark1.3开始就有的,它是一种以RDD为基础的分布式无类型数据集,类似于传统数据库中的二维表格。Da...原创 2019-05-08 10:43:32 · 1356 阅读 · 1 评论 -
基于Spark实现电影点评系统用户行为分析—RDD篇(一)
文章目录1、项目背景2、数据描述3、代码实现1、项目背景电影推荐系统(MovieLens)是美国明尼苏达大学(Minnesota)计算机科学与工程学院的GroupLens项目组创办的,是一个非商业性质的、以研究为目的的实验性站点。电影推荐系统注要使用协同过滤和关联规则相结合的技术,向用户推荐他们感兴趣的电影。本项目的数据集来源:https://grouplens.org/datasets/mo...原创 2019-04-25 09:54:37 · 3505 阅读 · 0 评论