Hive-sql
文章平均质量分 84
饮马长城窟
这个作者很懒,什么都没留下…
展开
-
数据埋点梳理
目录介绍:埋点文档介绍:埋点是流量数据采集的一种主要方式, 是分析用户行为的重要手段。本质上可以理解为,一次html动作触发了网络请求, 并被服务端的框架存储下来的行为。按照埋点实现方案分为按照HTML行为触发网络请求的方式可以划分为点击事件:用户每点击页面按钮一次就记录一次数据。曝光事件:当用户成功进入一个页面时记录一次数据,当刷新一次页面也会记录一次数据,如果通过手机HOME键切换出去,则不会记录。页面停留时长:页面停留时长主要用来记录用户在一个页面的停...原创 2021-10-27 14:53:53 · 1868 阅读 · 1 评论 -
Java-字符串操作和正则表达式
hive的正则匹配用的是java那一套一:字符串基本操作 String s1="ac"; //不创建对立对象的新建方式byte bys[]=new byte[]{'e','y','l'};String s2=new String(bys,0,bys.length); //通过数组新建对象System.out.println(s1+s2); String s1="abcdef...原创 2015-07-24 14:49:48 · 311 阅读 · 0 评论 -
MongoDb数据库-I基础
sd原创 2017-03-25 20:12:24 · 286 阅读 · 0 评论 -
数据仓库C
存储格式 文本导入到hive中,必须是TextFile格式. RCFile 存储空间TextFIle原创 2017-06-07 21:26:54 · 306 阅读 · 1 评论 -
数据仓库B
HDFS Hadoop Dietribute Filesystem 存储块 block MapReduce Map-combiner-shuffler-reduce YARN介绍 ZoopKeeper 用于故障转移,当资源管理器失败后,另一个可以马上恢复. datanode–读取数据 Hadoop工作过程 HIVE介绍 进入hive的操作界原创 2017-06-03 18:50:46 · 294 阅读 · 0 评论 -
数据仓库A
BI 企业大数据服务结构 大数据etl技术 Informatica datastage之类的已经不用了,现用大数据的定制化开发. greenPlum之前使用的大数据etl平台 ①SCD问题处理方法并举例 ②ODS是什么,在数据仓库的作用. :ods是短期的实时的数据,供产品或者运营人员日常使用,而数据仓库是供战略决策使用的数据;ods是可以更新的数据,数据仓库是基本不更新原创 2017-05-30 12:42:31 · 823 阅读 · 0 评论