及未来
码龄8年
关注
提问 私信
  • 博客:179,900
    179,900
    总访问量
  • 106
    原创
  • 34,093
    排名
  • 264
    粉丝
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2017-03-14
博客简介:

Jweilai

博客描述:
把每一天都过程一部杰作
查看详细资料
  • 原力等级
    当前等级
    4
    当前总分
    672
    当月
    1
个人成就
  • 获得364次点赞
  • 内容获得27次评论
  • 获得366次收藏
  • 代码片获得184次分享
创作历程
  • 47篇
    2024年
  • 6篇
    2023年
  • 4篇
    2022年
  • 3篇
    2021年
  • 10篇
    2020年
  • 25篇
    2019年
  • 17篇
    2018年
成就勋章
TA的专栏
  • 心得随笔
    8篇
  • 一天一道面试题
    39篇
  • Kafka
    2篇
  • 学习笔记
    2篇
  • 设计模式
    3篇
  • Flume
    1篇
  • 错误处理
    13篇
  • Web
    1篇
  • 数据结构
    2篇
  • Linux命令
    5篇
  • 计算机基础
    1篇
  • 大数据
    11篇
  • Spark
    7篇
  • Azkaban
    3篇
  • HDFS
    2篇
  • Oracle
    5篇
  • Kettle
    6篇
  • Java
    5篇
  • SQL
    3篇
  • Zookeeper
    1篇
兴趣领域 设置
  • 大数据
    spark
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

【报错处理】MR/Spark 使用 BulkLoad 方式传输到 HBase 发生报错: NullPointerException

【报错处理】MR/Spark 使用 BulkLoad 方式传输到 HBase 发生报错: NullPointerException
原创
发布博客 2024.10.16 ·
302 阅读 ·
4 点赞 ·
0 评论 ·
0 收藏

【随笔】不要用羞耻来定义 “部分成功”

重视学习路上的微小进步和失败,这不是失败,不应愧疚,而是“部分成功”
原创
发布博客 2024.10.12 ·
318 阅读 ·
6 点赞 ·
0 评论 ·
4 收藏

还有人不知道这样无痛养成好习惯?

还有人不知道这样无痛养成好习惯?分享我养成日常锻炼的好习惯的故事
原创
发布博客 2024.10.10 ·
298 阅读 ·
6 点赞 ·
0 评论 ·
10 收藏

【复盘】近期博客内容升级

一步一个脚印,一天一道大数据面试题祝你身体健康,事事顺心!近期和线下同事领导们聊天,感受到自己的博客有可以升级,变得,变得。和各位分享一下打算升级的背景,原因。
原创
发布博客 2024.09.10 ·
422 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

【大数据面试题】37 Doris 是怎么保证性能的?

一步一个脚印,一天一道大数据面试题祝你身体健康,事事顺心!Doris 是当下大热的 MPP 数据库,下面来聊聊它如何保证高性能的部分。
原创
发布博客 2024.07.21 ·
639 阅读 ·
4 点赞 ·
0 评论 ·
7 收藏

【大数据面试题】38 说说 Hive 怎么行转列

一步一个脚印,一天一道大数据面试题祝你身体健康,事事顺心!
原创
发布博客 2024.07.21 ·
662 阅读 ·
5 点赞 ·
1 评论 ·
0 收藏

【大数据面试题】36 你平时优化代码有什么方法,思路?

一步一个脚印,一天一道大数据面试。上次梳理了Spark优化,最近想了想通用的优化方法。就是不管优化哪种语言哪种框架都通用的优化思路。分享就是收获,我们开始吧!
原创
发布博客 2024.07.08 ·
264 阅读 ·
2 点赞 ·
0 评论 ·
5 收藏

【大数据面试题】35 Spark 怎么做优化?

一步一个脚印,一天一道大数据面试题祝你身体健康,事事顺心!Spark 如何做优化一直是面试过程中常问的问题。那么这次也仅以此篇文章总结梳理,希望对大家有帮助。
原创
发布博客 2024.07.01 ·
847 阅读 ·
10 点赞 ·
0 评论 ·
17 收藏

【随笔】提高代码学习水平(以更高的视角看事物)

最近,我感觉到自己的代码水平似乎卡在了一个瓶颈。似乎只想着数仓,Hive,Spark技术优化,但只要稍微离开这几个点,我就感到无所适从。我开始反思,或许,我应该总结一下自己的学习方法。
原创
发布博客 2024.06.28 ·
431 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏

【随笔】复盘有感

复盘总结,是我们做得更好的最好方法。
原创
发布博客 2024.06.03 ·
202 阅读 ·
6 点赞 ·
0 评论 ·
2 收藏

【大数据面试题】34 手写一个 Flink SQL 样例

一步一个脚印,一天一道大数据面试题祝你身体健康,事事顺心!我们来看看Flink SQL。
原创
发布博客 2024.05.29 ·
499 阅读 ·
7 点赞 ·
1 评论 ·
6 收藏

【大数据面试题】33 Flink SQL做过哪些优化?

一步一个脚印,一天一道面试题 简单写几个Flink SQL的优化。
原创
发布博客 2024.05.26 ·
407 阅读 ·
3 点赞 ·
0 评论 ·
1 收藏

【大数据面试题】32 Flink 怎么重复读 Kafka?

一步一个脚印,一天一道面试题。我是近未来,祝你变得更强!首先,为什么要读过的。
原创
发布博客 2024.05.22 ·
404 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

【大数据面试题】31 Flink 有哪些重启方法

Checkpoint是Flink的另一种状态快照机制,它比Savepoint更为频繁,提供了细粒度的状态恢复点。通过配置Checkpoint,Flink会周期性地自动保存作业的状态。如果作业失败,Flink可以根据最后一个成功的Checkpoint自动重启并恢复状态,从而达到“恰好一次”或“至少一次”的处理语义。要启用Checkpoint,需要在作业配置中开启Checkpoint并设置Checkpoint的参数,如间隔时间、模式等。类似,是拿来保存当时状态的一个机制。以便后续可以从这个状态恢复执行。
原创
发布博客 2024.05.21 ·
390 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

【大数据面试题】30 Kafka如何保证数据可靠性

数据可靠性一直是各个技术都需要的一个特性。不能在使用过程中数据被错误消费,多消费少消费,或者直接漏了数据。那就来看看热门消息队列 Kafka 在数据可靠性方面做了些什么。
原创
发布博客 2024.05.17 ·
413 阅读 ·
3 点赞 ·
0 评论 ·
1 收藏

【大数据面试题】29 Kafka 为什么读写那么快?

Kafka是热门的消息队列组件,在大数据中十分常见。Kafka的是其成为热门组件的重要原因。那么就来聊聊,Kafka为什么那么快。
原创
发布博客 2024.05.16 ·
248 阅读 ·
9 点赞 ·
0 评论 ·
4 收藏

【大数据面试题】28 解释一下大数据的 5V 特性是什么?

一步一个脚印,一天一道面试题。搞点简单的。
原创
发布博客 2024.05.15 ·
529 阅读 ·
3 点赞 ·
0 评论 ·
4 收藏

【大数据面试题】27 讲下Doris的物化视图

物化视图,顾名思义,是将一个查询的结果预先计算并存储为物理表的形式。这意味着,原本需要在运行时动态执行的复杂查询,现在变成了直接从已经计算好的结果表中读取数据,极大地提升了查询速度。它是一种典型的“空间换时间”的策略,牺牲一定的存储空间来换取查询性能的显著提升。
原创
发布博客 2024.05.15 ·
578 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

【大数据面试题】26 解释一下数据湖(Data Lake)的概念,以及它与数据仓库的区别

数据湖(Data Lake)是一种集中存储企业所有原始数据的体系结构,它允许数据以原始、未经过加工的格式被收集并存储。这种存储方式通常不预先定义数据的结构,而是保留数据的原始形态,包括结构化数据(如关系数据库中的表格数据)、半结构化数据(如CSV、日志文件、XML、JSON)和非结构化数据(如文本文件、图像、音频、视频等)。数据湖的核心价值在于它提供了一个灵活的环境,让企业能够在需要时对数据进行分析、处理和转化,适应各种不同的业务需求和分析场景。
原创
发布博客 2024.05.11 ·
401 阅读 ·
4 点赞 ·
0 评论 ·
6 收藏

【大数据面试题】25 说说你对 Doris 的理解

Doris 能很好地与Hadoop、Spark等大数据生态系统集成,也支持与各类BI工具对接,便于数据可视化和报告生成。:MPP 架构和列式存储设计让 Doris 能够处理高并发的查询请求,即使在数据量庞大的情况下也能保持查询的高效性。其定位更倾向于提供一种统一的分析平台,兼顾实时性和大规模数据处理能力,满足企业多样化的数据分析需求。Doris 既可以作为实时数仓使用,支持企业对数据的实时监控和决策需求,也可以作为离线分析的数据仓库,处理历史数据的深度分析和挖掘。,也就是说,对实时导入的数据会更友好。
原创
发布博客 2024.05.10 ·
853 阅读 ·
3 点赞 ·
0 评论 ·
5 收藏
加载更多