guo158799
码龄5年
关注
提问 私信
  • 博客:3,737
    动态:19
    3,756
    总访问量
  • 11
    原创
  • 181,652
    排名
  • 43
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2020-03-13
博客简介:

guo158799的博客

查看详细资料
  • 原力等级
    当前等级
    1
    当前总分
    62
    当月
    0
个人成就
  • 获得52次点赞
  • 内容获得1次评论
  • 获得46次收藏
创作历程
  • 9篇
    2024年
  • 1篇
    2021年
  • 1篇
    2020年
成就勋章
TA的专栏
  • 笔记
    2篇
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

sql分页查询

1.执行带有OFFSET的分页查询时,OFFSET关键字告诉数据库跳过前面的多少条记录。例如,要查询users表中的第二页数据,并且每页显示10条记录。表示从users表中选取10条记录,但跳过前面的10条记录。
原创
发布博客 2024.07.15 ·
151 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

kafka中的稀疏索引

生产者生产的数据会不断追加到 log 文件中,如果 log 文件很大了,就会导致定位数据变慢,因此 kafka 会将大的 log 文件分为多个 segment,每个 segment 会对应.log 文件和.index 文件和.timeindex 文件,.log 存储数据,.index 存储偏移量索引信息,.timeindex 存储时间戳索引信息。当消费者需要读取特定偏移量的消息时,它首先使用这个稀疏索引来确定消息所在的数据文件的大致位置,然后再从这个位置开始顺序读取,直到找到所需的消息。
原创
发布博客 2024.07.12 ·
416 阅读 ·
5 点赞 ·
0 评论 ·
6 收藏

sql面试题(连续登录相关)

这个day_con代表了每个用户连续登录的天数(尽管在t3的分组中实际上计算的是总的登录天数)。计算日期差异:通过DATE_SUB()函数计算当前登录日期与前一登录日期的差异,如果这个差异为1,则认为这两个登录记录是连续的。使用ROW_NUMBER()函数为每个用户的登录记录分配一个序列号,序列号的分配依据是登录日期的先后顺序。计算相邻登录记录之间的日期差异,如果这个差异为1,则表明这两个登录记录是连续的。筛选连续登录记录:根据日期差异的结果,筛选出连续登录的用户记录。2.连续登录最大天数用户。
原创
发布博客 2024.07.11 ·
900 阅读 ·
13 点赞 ·
0 评论 ·
12 收藏

sql相关

计算日期差异:通过DATE_SUB()函数计算当前登录日期与前一登录日期的差异,如果这个差异为1,则认为这两个登录记录是连续的。对于频繁的重复查询,可以考虑使用缓存来减少数据库的负载,如使用内存缓存(如Redis)或者数据库缓存(如MySQL的查询缓存)。数据去重:由于同一用户可能在同一天内有多次登录记录,因此首先需要对登录记录进行去重处理,只保留每个用户每天的一条记录。使用ROW_NUMBER()函数为每个用户的登录记录分配一个序列号,序列号的分配依据是登录日期的先后顺序。sql的优化:加索引;
原创
发布博客 2024.06.11 ·
776 阅读 ·
9 点赞 ·
0 评论 ·
14 收藏

数据仓库分层

问题①:数据分层,ods,dws,dwd,ads每层的作用,分层的好处。问题②:数据仓库建模方法,维度建模分几种,各自的结构和特点。问题③结合自己工作谈一下数据分层和数据建模。
原创
发布博客 2024.06.10 ·
211 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

set和list

Set是无序的集合,它不支持通过索引来访问元素,可以判断某个元素是否在集合中,检查元素element是否存在于Set中,使用set.contains(element)。给定一系列字符串,从集合的set和list中查询,如何查询出相关的数据,同时set和list有什么区别?set表示无序,不可重复的集合(哈希表实现);list(动态数组实现)是有序,可重复的集合。获取第二个元素,可以使用list.get(1)取数。
原创
发布博客 2024.06.10 ·
125 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

用户session访问时长的计算

【代码】用户session访问时长的计算。
原创
发布博客 2024.06.10 ·
144 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

SQL164 2021年11月每天新用户的次日留存率

【代码】SQL164 2021年11月每天新用户的次日留存率。
原创
发布博客 2024.06.10 ·
197 阅读 ·
5 点赞 ·
0 评论 ·
2 收藏

flume问答

为了解决这个问题,可以采取一些措施,如增加Flume Agent的数量,使用可靠的文件通道(File Channel)代替内存通道(Memory Channel),或者实施集群部署以提高系统的稳定性和可靠性1。Flume采集日志是通过流的方式直接将日志收集到存储层,而Kafka则是将日志缓存在Kafka集群中,之后再进行采集。如果Flume采集过程中断,可以通过文件记录之前的日志,而Kafka则是通过偏移量(offset)记录之前的日志1。相比之下,Flume的方式更为灵活,便于快速切换和维护1。
原创
发布博客 2024.06.09 ·
710 阅读 ·
10 点赞 ·
1 评论 ·
12 收藏

互斥在同步之后

发布动态 2021.02.23

2021-02-06

标识符必须是数字,字母,下划线,首标识符必须是字母或下划线
原创
发布博客 2021.02.06 ·
54 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

2020-09-22

存储稀疏图,用邻接表更省空间有n个顶点,和n条边的无向图一定是有环的拓扑序列是在有向无环图中进行的,不存在回路
原创
发布博客 2020.09.22 ·
53 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏