何以解忧唯有暴富230
码龄3年
关注
提问 私信
  • 博客:4,393
    4,393
    总访问量
  • 4
    原创
  • 2,201,714
    排名
  • 165
    粉丝
  • 41
    铁粉

个人简介:代码和我只有一个能跑

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:江苏省
  • 加入CSDN时间: 2022-06-16
博客简介:

weixin_72084172的博客

查看详细资料
  • 原力等级
    当前等级
    1
    当前总分
    85
    当月
    3
个人成就
  • 获得64次点赞
  • 内容获得3次评论
  • 获得65次收藏
  • 代码片获得236次分享
创作历程
  • 4篇
    2024年
成就勋章
兴趣领域 设置
  • Python
    pythondjangoscrapynumpypandas
  • 大数据
    大数据
  • 后端
    爬虫
  • 操作系统
    linuxcentos
  • 云平台
    云计算
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

大数据职业技能大赛样题(综合分析-02)

通过 min.insync.replicas 设置,在写入视为成功前,必须有指定数量的副本同步数据。增加副本数( replication.factor ),以便在某些副本失败时仍保留数据。合理配置生产者的 retry 和 timeout 设置,以便在遇到问题时进行重试。配置生产者的确认机制( acks ),以确保数据被多个副本确认后才视为成功写入。这些类型表示计算任务相对于数据存储位置的近程度,以减少数据传输开销。数据在同一节点的不同进程中。数据在同一机架的不同节点上。数据在集群的任何地方。
原创
发布博客 2024.01.28 ·
649 阅读 ·
5 点赞 ·
1 评论 ·
3 收藏

大数据职业技能大赛样题(综合分析-01)

以队列为基础,各队列拥有⼀定的容量。适合多租户环境,确保资源按需分配。先进先出策略,按作业提交的顺序进⾏处理。简单但不适⽤于共享集群。确保所有作业公平地获得资源。动态调整,以满⾜不同作业的资源需求。在指定时间内允许的最大失败次数。设定固定次数和延迟时间。(指定时间间隔内的最大失败次数)、
原创
发布博客 2024.01.25 ·
719 阅读 ·
11 点赞 ·
0 评论 ·
11 收藏

大数据职业技能大赛样题(数据采集与实时计算:使用Flink处理Kafka中的数据)

另外对于数据结果展示时,不要采用例如:1.9786518E7的科学计数法)。
原创
发布博客 2024.01.25 ·
1904 阅读 ·
25 点赞 ·
2 评论 ·
26 收藏

大数据职业技能大赛样题(数据采集:Flume多路复用存入Kafka+HDFS)

三台服务器都配置,其中broker.id、advertised.listeners参数不一样,其它配置都一样$ZOOKEEPER/conf目录下,三台服务器的zoo.cfg配置文件都一样。
原创
发布博客 2024.01.23 ·
1120 阅读 ·
23 点赞 ·
0 评论 ·
25 收藏