日常分享
文章平均质量分 55
as123152
大数据相关工作者
展开
-
分析模型——漏斗分析
三个概念,1.漏斗步骤 2.漏斗时间范围 3.漏斗窗口期 漏斗步骤指的就是在转化流程中的一个关键节点,每个漏斗步骤都是由一个事件组成的。 漏斗的时间范围是指漏斗第一个步骤发生的时间范围。 漏斗窗口期指的是完成整个漏斗转换的时间限制,只有在这个时间范围内,用户从第一个步骤,进行到最后一个步骤,才能被视为一个成功的转化。 1. 步骤:漏斗的每一步,其实就是一个行为事件或者带条件的行为事件 2. 时间范围: 指的是漏斗发生的时间范围 3. 窗口期:指的是用户完成漏斗的时间限制,只有在这个窗口期的...原创 2021-07-02 16:12:21 · 1437 阅读 · 0 评论 -
2021-05-08
Hive中的函数(二) 1.窗口函数 窗口函数又名开窗函数,属于分析函数的一种。用于解决复杂报表统计需求的功能强大的函 数。窗口函数用于计算基于组的某种聚合值,它和聚合函数的不同之处是:对于每个组返回 多行,而聚合函数对于每个组只返回一行。开窗函数指定了分析函数工作的数据窗口大小, 这个数据窗口大小可能会随着行的变化而变化。 ·默认的数据库的查询都是要么详细记录,要么聚合分析,如果要查询详细记录和聚合数据,必 须要经过两次查询 ·简单的说窗口函数对每条详细记录开一个窗口,进行聚合统计的查.原创 2021-05-08 08:15:15 · 338 阅读 · 0 评论 -
2021-04-28
Hive中的函数(一) 一.系统内置函数 1.查看函数 显示hive中的所有函数:show function; 查看某个函数的用法:desc function array; 2.1时间戳转日期 select from_unixtime(15524625468); select from_unixtime(15524625468,yyyymmdd); select from_unixtime(15524625468,yyyy-mm-dd HH-mm-ss); 2.2.获取当前时间戳 sel原创 2021-04-28 21:31:15 · 123 阅读 · 0 评论 -
2021-04-22
yarn设计思想 yarn的基本思想是将资源管理和作业调度/监视功能划分为单独的守护进程。其思想是拥有一个全局的ResourceManager(AM)。应用程序可以是单个作业,也可以是一组作业,一个ResourceManager和多个NodeManager构成了yarn资源管理框架。他们是yarn启动后长期...原创 2021-04-25 08:42:56 · 79 阅读 · 0 评论