- 博客(6)
- 收藏
- 关注
原创 每天的留存率计算
问题背景:给出一张流水表A,字段:uid,date(时间戳、流水中每次的登录时间),day(每天分区,格式yyyymmdd),增量表,以update_time分区),希望输出以下表格,其中,横坐标和纵坐标自动更新每天的留存情况每天留存情况 日期 新增用户数 次日留存用户数 三日留存用户数 四日留存用户数 ...... 2021-3-1 2021-3-2 .....
2021-09-07 09:52:33
769
转载 字符串处理
一、准备创建虚表:echo “X” >> dual.tsvhadoop fs -put dual.tsv ‘/data//’create table dual(dummy string);load data local inpath '/data//dual.tsv’ overwrite into table dual;二、应用字符串长度函数:length语法: length(string A)返回值: int说明:返回字符串A的长度hive> select le
2021-07-02 11:56:16
145
原创 hive sql常用函数总结
1. limit 与offset用法1. LIMIT [参数1]--m,参数2--n; #表示从跳过m条数据开始取n行数据 #参数1为可选参数,表示跳过m条数据(默认为0),-- eg:1表示从第二行开始 #参数2为必选参数,表示取几行数据-- eg1: SELECT * FROM table LIMIT 5; //检索前 5 个记录行等价于SELECT * FROM table LIMIT 0,5; //检索前 5 个记录行-- eg2: SELECT * FROM tabl...
2021-04-02 16:51:27
3488
2
原创 mac pycharm IDE 配置默认代码和注释
macpycharm IDE 配置默认代码和注释步骤:1. 打开pycharm ,打开左上角File;2. File-> preferpreference for new project-> Editor -> File and Code Templates -> Python Script3.# -*- coding: utf-8 -*- # @Time : ${DATE} ${TIME} # @Author : JJ# @File : ${...
2021-03-30 14:26:09
266
原创 在anaconda中无法新建一个环境
问题:在anaconda下create新环境时,创建后闪退,无报错,无显示解决方案:终端下,在/anaconda3/envs/目录下,使用conda create - n ${名字} 创建新环境,然后启动 conda activate data-anlysis返回anaconda即可...
2021-03-29 21:02:55
638
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人