![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
sql
文章平均质量分 68
valkyrja110
这个作者很懒,什么都没留下…
展开
-
数仓开发拉链表
数仓开发拉链表1.拉链表介绍2.首次全量同步数据3.处理每天新产生的数据(1)新产生的数据主要分为2种:(2)新产生数据的开链和闭链4.对拉链表中发生修改的数据进行开链和闭链5.整合所有数据6.总结1.拉链表介绍假如有一个业务数据表user_info,里面记录了用户的基本信息,主键、姓名、年龄、性别、地址、电话、数据更新日期。由于用户可能会修改个人信息,为了更好地记录、溯源,所以建立了拉链表来对所有的历史修改的数据进行记录。主要就是对每条数据增加了数据的有效期区间bdate和edate,就是说这条数原创 2022-05-14 22:52:07 · 5209 阅读 · 4 评论 -
数据仓库知识点滴~字段顺序摆放【1】
数据仓库原创 2022-01-16 23:36:00 · 796 阅读 · 0 评论 -
sys_refcursor使用案例
sys_refcursor使用案例一、介绍二、sys_refcursor是一种数据类型一、介绍工作中看到了sys_refcursor的类型,之前没接触过,所以就上网搜一搜。可能是我技术比较垃圾,网上大部分的介绍都看不懂,没有一个最基础的介绍,最后我在微信公众号中看到了小白案例,在这里分享一下。二、sys_refcursor是一种数据类型sys_refcursor是一种数据类型,定义游标的数类型,网上介绍了什么各种静态、动态什么的,大家可以去参考,这里只介绍最基本的用法。create or repl原创 2021-12-18 22:22:04 · 2767 阅读 · 0 评论 -
kettle常见业务操作表输入-表输出
kettle常见业务操作一、kettle主要功能二、简述1.kettle过程描述2.输入控件3.输出控件4.kettle三、表输入-表输出1.建表2.造数据3.表输出四、新建转化一、kettle主要功能接触kettle很长时间了,现在已经改名为Pentaho Data Integration,就是数据整合的意思和原来的水壶很相像,数据从壶口装入,壶嘴统一输出。kettle的功能很多,我当时用的最多的就是跨数据库同步数据的功能,举例,把mysql数据库中的商品信息导入到orcle,因为涉及到跨数据库,手原创 2021-11-13 16:42:37 · 9393 阅读 · 1 评论 -
ORACLE 数据全量/增量同步 merge into 方法
ORACLE 数据全量/增量同步 merge into 方法一、业务介绍二、创建表三、准备数据四、merge into语法使用介绍1.主要综合学习了其他大佬的内容2.如果想全部插入3.删除数据一、业务介绍有old和new两张表,new是每天最新业务数据,old是上一天的业务数据,需要将new表中的数据更新或插入到old的主表中。二、创建表--创建第一张表create table old( id number(10) , name varchar2(20) , age num原创 2021-11-08 21:47:28 · 3822 阅读 · 2 评论 -
货拉拉sql互联网大厂面试真题在线练习
货拉拉sql面试真题在线练习一、sql刷题目的二、互联网大厂货拉拉sql面试题1.货拉拉sql数据表介绍2.货拉拉订单练习题sql语句(1)用车方和司机被禁止(banned=1)的比率分别为?明确问题:解题思路:参考答案答案思考时间(2)2020年1月25日的订单完成率为?明确问题:解题思路:参考答案:答案:思考时间:(3)用车至少两次,且主动取消过至少1次的用车方有多少名?明确问题:解题思路:参考答案:答案:思考时间:(4)北京、上海的非禁止用户的用车取消率分别为?明确问题:解题思路:参考答案:答案:思考原创 2021-09-20 01:22:31 · 1777 阅读 · 0 评论 -
对分数进行分段统计
分段统计题目描述吃力办法快捷办法题目描述有一个班的学生考试得分在[0, 100]范围中,老师想按每5分一个分段统计各段都有多少学生。吃力办法我当时用的是case when 对学生的成绩进行了20次的判断,进行分类,然后在进行分组计数快捷办法对所有学生的分数除5,将取整后的结果新增为一列,这样就直接将学生分数映射到了每5分的一个区间里面。3,4,2,1的得分,他们的取整都是0,所以都是在[0, 5)的区间中,其他分数同理。这样在直接进行分组统计就可以了,无需写20个判断条件。...原创 2021-09-13 22:51:05 · 563 阅读 · 0 评论 -
用户行为分析之时间间隔mysql实现
用户行为分析之时间间隔一、问题简介二、举例数据(login_data)三、实现方法1.lead()函数2.left join + row_number一、问题简介实际业务中会有很多关于时间间隔的分析,例如有30%用户使用产品或某一功能的时间间隔是2天,50%用户产品使用间隔是7天,15%用户产品使用间隔是10天,5%用户产品使用间隔大于15天。那么以上各类用户对应的人均付费情况、人群画像是否有什么区别,是否还有特殊的隐形行为,是否可以进行转化?大家可以发散思路,这里只是举例二、举例数据(login原创 2021-08-08 16:57:53 · 945 阅读 · 0 评论 -
求用户最大连续登陆天数mysql实现
用户连续登陆一、规定时间内用户最大连续登陆天数二、user_login表字段(所有用户登陆信息)三、分解步骤1.where初步筛选2.窗口函数分组排序4.计算获得连续的字段5.分组计算连续天数6.求得结果7.连续SQL8.使用函数总结(1)timestampdiff(unit, start, end)(2)窗口函数排序(3)date_sub()一、规定时间内用户最大连续登陆天数为了看有哪些忠实用户,积极使用产品,需要计算用户的连续登陆天数。二、user_login表字段(所有用户登陆信息)u原创 2021-08-06 23:32:40 · 2134 阅读 · 0 评论 -
2021-08-02
数据分析RFM模型 mysql实现RFM基本概念mysql关键点navicat操作主要使用方法建议RFM基本概念关于RFM的基本概念大家可以参见我上一篇文章数据分析RFM模型 Python实现mysql关键点本次主要是分享通过mysql的方法实现RFM,进行分析前需要对数据集进行清洗,清洗数据尽量还是使用python,感觉效率会高一些,10W行的数据,简单的left join加分组运算,navicat300多秒都不止。我这里只选择了200行数据做示例,原因是查询真的是太慢了。但是mysql确实展原创 2021-08-02 22:50:34 · 112 阅读 · 0 评论 -
mysql 用户留存率计算(每日新增DNU,次日留存率,3日留存率,7日留存率)
我是先学习了这位大神留存率的写法,然后我自己完善了一下。@阿柯@首先声明一下留存的概念次日留存:1月1日注册的新用户,在1月2日登陆了app。即登陆日期 - 注册日期 = 1天。3日留存:1月1日注册的新用户,在1月3日登陆了app。即登陆日期 - 注册日期 = 2天。7日留存:1月1日注册的新用户,在1月8日登陆了app。即登陆日期 - 注册日期 = 6天。但是目前不同公司对留存的定义不太一样,所以以具体的规则为准,这里只是为了方便大家理解。表user_infor,包含user_id(用户原创 2020-09-26 22:07:33 · 13380 阅读 · 10 评论 -
用户行为分析,指定操作顺序
用户行为表tracking_log用户id操作编号操作时间user_idopr_idlog_time计算每天的访客数和他们的平均操作次数。select date(log_time), count(distinct user_id) as 访客数量, count(opr_id) as 操作次数, count(opr_id) / count(distinct user_id) as 平均操作次数from tracking_loggroup by date(log_原创 2020-09-24 22:26:31 · 404 阅读 · 0 评论 -
SQL面试题 拼多多
活动运营数据表表orders用户id订单金额下单时间user_idorder_payorder_time表act_apply活动编号报名用户id报名时间act_iduser_idact_time统计每个活动对应所有用户在报名后产生的总订单金额,总订单数。(每个用户限报一个活动,题干默认用户报名后产生的订单均为参加活动的订单)。select act_id, sum(order_pay) as 总订单金额, count(orde原创 2020-09-24 20:18:13 · 789 阅读 · 0 评论 -
mysql常见日期函数用法
mysql 常见日期函数用法-- 获取当前日期 NOW()输入:SELECT NOW();输出:2020-07-25 14:38:39-- 获取当前日期的年 YEAR(date)输入:SELECT YEAR(NOW());输出:2020-- 获取当前月份 MONTH(date)输入:SELECT MONTH(NOW());输出:7-- 获取当前日期 DAY(date)输入:SELECT DAY(NOW());输出:25-- 获取本周为今年第多少周 WEEKOFYEAR(da原创 2020-07-25 16:21:26 · 323 阅读 · 0 评论 -
SQL索引,什么是索引,索引的作用,为什么使用B+Tree
接触sql小半年了,网上大神说索引非常重要!!!!但是一直很蒙,相信很多朋友也是这样,这里特来和大家分享一下我是如何明白的。明白的前提:1.了解基本数据结构内容:树形结构、二分查找、时间复杂度2.了解磁盘和内容之间的数据读取IO索引是什么:索引是帮助mysql高效提取数据的一种数据结构网上大神进行的总结,当你理解索引后,你会感觉这个说法感觉超级棒!!索引的基础就是排序,这一点很重要。 然后结合二分查找,时间就会大幅度降低,远低于线性查找。这就是采用树型数据结构的前提之.原创 2020-07-09 22:57:36 · 495 阅读 · 0 评论