数据分析
文章平均质量分 55
JJ.Song
这个作者很懒,什么都没留下…
展开
-
每天的留存率计算
问题背景:给出一张流水表A,字段:uid,date(时间戳、流水中每次的登录时间),day(每天分区,格式yyyymmdd),增量表,以update_time分区),希望输出以下表格,其中,横坐标和纵坐标自动更新每天的留存情况每天留存情况 日期 新增用户数 次日留存用户数 三日留存用户数 四日留存用户数 ...... 2021-3-1 2021-3-2 .....原创 2021-09-07 09:52:33 · 825 阅读 · 0 评论 -
常用日期函数
hive中常用日期函数及其转化原创 2021-08-04 15:41:04 · 4021 阅读 · 0 评论 -
字符串处理
一、准备创建虚表:echo “X” >> dual.tsvhadoop fs -put dual.tsv ‘/data//’create table dual(dummy string);load data local inpath '/data//dual.tsv’ overwrite into table dual;二、应用字符串长度函数:length语法: length(string A)返回值: int说明:返回字符串A的长度hive> select le转载 2021-07-02 11:56:16 · 173 阅读 · 0 评论 -
hive sql常用函数总结
1. limit 与offset用法1. LIMIT [参数1]--m,参数2--n; #表示从跳过m条数据开始取n行数据 #参数1为可选参数,表示跳过m条数据(默认为0),-- eg:1表示从第二行开始 #参数2为必选参数,表示取几行数据-- eg1: SELECT * FROM table LIMIT 5; //检索前 5 个记录行等价于SELECT * FROM table LIMIT 0,5; //检索前 5 个记录行-- eg2: SELECT * FROM tabl...原创 2021-04-02 16:51:27 · 3624 阅读 · 2 评论 -
mac pycharm IDE 配置默认代码和注释
macpycharm IDE 配置默认代码和注释步骤:1. 打开pycharm ,打开左上角File;2. File-> preferpreference for new project-> Editor -> File and Code Templates -> Python Script3.# -*- coding: utf-8 -*- # @Time : ${DATE} ${TIME} # @Author : JJ# @File : ${...原创 2021-03-30 14:26:09 · 304 阅读 · 0 评论 -
在anaconda中无法新建一个环境
问题:在anaconda下create新环境时,创建后闪退,无报错,无显示解决方案:终端下,在/anaconda3/envs/目录下,使用conda create - n ${名字} 创建新环境,然后启动 conda activate data-anlysis返回anaconda即可...原创 2021-03-29 21:02:55 · 653 阅读 · 0 评论