排序:
默认
按更新时间
按访问量

spark 项目应用-topn搜索热词统计

本文章通过spark读取hive数据,分析top热点搜索词import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.Iterator; import java.ut...

2018-04-16 09:29:13

阅读数:237

评论数:0

spark项目应用-新闻网站关键指标离线分析

本文章主要通过spark sql实现新闻网站关键指标的离线分析功能1 页面pv统计以及排序2 页面uv统计以及排序3 新用户注册比例统计4 用户跳出比例统计5 板块热度排行榜统计首先需要生成对应的访问数据import java.io.FileOutputStream; import java.io...

2018-04-16 09:28:37

阅读数:173

评论数:0

spark 实际项目分析-移动端app日志

本文章是企业的一个真实案例简化而来的,主要是统计那个用户的下载流量和上传流量,从而真实分析出每个用户的流量使用情况为完成此功能需要4个类1 AccessLogInfo.java: 用户流量实体信息public class AccessLogInfo implements Serializable ...

2018-04-15 15:57:14

阅读数:325

评论数:0

spark排序版本的woldcount

通过代码实现woldcount统计且根据count进行排序package cn.spark.study.core; import java.util.Arrays; import org.apache.spark.SparkConf; import org.apache.spark.api.j...

2018-04-15 14:56:54

阅读数:48

评论数:0

spark 单词统计

本文通过代码实现spark的本地wordcount统计功能和集群模式的worldcount统计功能public class WordCountLocal { public static void main(String[] args) { // 编写Spark应用程序 ...

2018-04-15 14:53:30

阅读数:106

评论数:0

提示
确定要删除当前文章?
取消 删除