自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 每天的留存率计算

问题背景:给出一张流水表A,字段:uid,date(时间戳、流水中每次的登录时间),day(每天分区,格式yyyymmdd),增量表,以update_time分区),希望输出以下表格,其中,横坐标和纵坐标自动更新每天的留存情况每天留存情况 日期 新增用户数 次日留存用户数 三日留存用户数 四日留存用户数 ...... 2021-3-1 2021-3-2 .....

2021-09-07 09:52:33 769

原创 常用日期函数

last_day获取每个月最后一天

2021-08-04 15:41:04 3621

转载 字符串处理

一、准备创建虚表:echo “X” >> dual.tsvhadoop fs -put dual.tsv ‘/data//’create table dual(dummy string);load data local inpath '/data//dual.tsv’ overwrite into table dual;二、应用字符串长度函数:length语法: length(string A)返回值: int说明:返回字符串A的长度hive> select le

2021-07-02 11:56:16 145

原创 hive sql常用函数总结

1. limit 与offset用法1. LIMIT [参数1]--m,参数2--n; #表示从跳过m条数据开始取n行数据 #参数1为可选参数,表示跳过m条数据(默认为0),-- eg:1表示从第二行开始 #参数2为必选参数,表示取几行数据-- eg1: SELECT * FROM table LIMIT 5; //检索前 5 个记录行等价于SELECT * FROM table LIMIT 0,5; //检索前 5 个记录行-- eg2: SELECT * FROM tabl...

2021-04-02 16:51:27 3488 2

原创 mac pycharm IDE 配置默认代码和注释

macpycharm IDE 配置默认代码和注释步骤:1. 打开pycharm ,打开左上角File;2. File-> preferpreference for new project-> Editor -> File and Code Templates -> Python Script3.# -*- coding: utf-8 -*- # @Time : ${DATE} ${TIME} # @Author : JJ# @File : ${...

2021-03-30 14:26:09 266

原创 在anaconda中无法新建一个环境

问题:在anaconda下create新环境时,创建后闪退,无报错,无显示解决方案:终端下,在/anaconda3/envs/目录下,使用conda create - n ${名字} 创建新环境,然后启动 conda activate data-anlysis返回anaconda即可...

2021-03-29 21:02:55 638

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除