【程序设计赛】第5届天池全球数据库大赛 #¥150000 #双赛道

CompHub 主页增加了“近两周上新的奖金赛”,更加方便查找最新比赛,欢迎访问和反馈!


最新更新的比赛会第一时间在群里通知,欢迎加群交流!(公众号回复“加群”即可)


以下内容摘自比赛主页(点击文末阅读原文进入)

Part1赛题介绍

题目

第5届天池全球数据库大赛 (赛道1赛道2

举办平台

阿里天池

主办方

阿里云

背景

2023年第5届天池全球数据库大赛,是由阿里云主办,阿里云天池平台、阿里云瑶池数据库和开发者社区承办的数据库年度品牌赛事。自2018年以来,“阿里云数据库大赛”已经连续成功举办四届,吸引了国内外数千支队伍和个人参加,参赛者遍布11个国家和地区。

云计算为数据库的架构发展开辟了新的技术路径,与传统数据库相比,云原生数据库能够充分利用云计算潜力,最大的技术变革是资源池化与资源解耦,以及由此而来的弹性、高可用、智能化运维等核心能力。

本届大赛采用双赛道机制,聚焦高性能共享存储、海量数据高效读写等核心业务场景,设计最优的数据结构,挑战数据库业界难题,探索数据库性能优化新范式。

【赛道1】云原生数据库PolarDB业务数据压缩挑战:https://tianchi.aliyun.com/competition/entrance/532117/introduction

【赛道2】云原生多模数据库Lindorm时序数据处理性能挑战:https://tianchi.aliyun.com/competition/entrance/532118/introduction

Part2时间安排

  • 报名、组队与实名认证(即日起— 2023年8月28日,UTC+8)

  • 【初赛】(2023年7月13日- 9月4日,UTC+8)

  • 【复赛】(2023年9月7日-11月3日,UTC+8)

  • 【决赛】(暂定2023年12月)

Part3奖励机制

「云原生数据库PolarDB业务数据压缩挑战」赛道共设奖金15万元人民币

  • 冠军:1支队伍,每支队伍奖金6万元人民币,颁发获奖证书。

  • 亚军:2支队伍,每支队伍奖金2万元人民币,颁发获奖证书。

  • 季军:3支队伍,每支队伍奖金1万元人民币,颁发获奖证书。

  • 优胜奖:4支队伍,每支队伍奖金5千元人民币,颁发获奖证书。(上述奖项以总决赛答辩的最终名次决定)

  • 参与奖:初赛TOP50队伍的选手将获得大赛限量版纪念T恤一件,数量按照各队伍选手人数发放。

  • 极客奖——内推直通车:复赛最终排名入围TOP20所在队伍的选手,将获得阿里云数据库产品事业部优先推荐招聘名额。

Part4赛题描述

赛道一:云原生数据库PolarDB业务数据压缩挑战

PolarDB是阿里云瑶池旗下的自研云原生数据库。自6年前诞生伊始,PolarDB产品日益成熟,持续进行创新,并维护了大量云上核心用户的海量数据。PolarDB在业界率先提出了计算、内存、共享存储的三层解耦架构。PolarDB是国内首个使用共享存储架构的数据库产品,基于自研的PolarStore高性能网盘,PolarDB拥有高IO性能和存储弹性。

在PolarDB的共享存储架构中,主节点与多个只读节点共同读写统一的高性能存储。共享存储部分使用“按量计费”的方式,对实际产生的持久化数据收取存储费用,“数据页”在持久化数据中占比最高。如果能对数据页压缩存储,将进一步降低用户的使用成本,从而提升产品价值。同时压缩的数据页也将降低整体的IO负载,从而提升性能。

数据页有一些突出特点,将影响压缩方法的设计:

  1. 数据被统一划分为16KB的数据页,以达到最佳的磁盘IO效率

  2. 数据由B+树维护,相同表内的数据字段格式统一

  3. 数据页读写性能较为敏感,将直接影响数据库整体性能

典型的数据库存储引擎中,用户读写请求并不直接读写持久化数据。Buffer Pool承接了对数据页的本地高频读写,从磁盘中读取数据页成为“Clean Page”,将不再被频繁访问的“Dirty Page”写回磁盘。

本次赛题专注于单个数据表的持久化数据读写,如图中红色部分所示。选手需要在给定的数据页读写接口下实现数据压缩与解压算法,并设计持久化数据的组织方式。比赛分为初赛和复赛两阶段。初赛与复赛使用相同的赛题,但有不同的要求与评分标准。初赛只评测“数据压缩率”,复赛将加入性能评测。

赛道二:云原生多模数据库Lindorm时序数据处理性能挑战

2011年,阿里基于开源数据库HBase构建了分布式半结构化存储系统Ali-HBase,服务于淘宝历史订单等大数据场景,经过多年的双十一历练,沉淀了高可用、高扩展等众多特性。随后,为了进一步优化HBase,阿里云瑶池正式推出云原生多模数据库Lindorm,相比于Ali-HBase,其在跨机房、性能成本、索引、SQL等方面获得全面增强,支撑着支付宝账单、手淘消息、阿里客服等关键业务,为阿里巴巴核心业务提供支撑。

近年来,随着阿里数字化能力服务实体经济的趋势,作为阿里云创新产品的Lindorm不断升级,为工业互联网、车联网等产业数字化升级融入了多种创新技术,支持宽表、时序、文本、对象、流、时空等多种数据的统一访问和融合处理,兼容SQL、HBase/Cassandra/S3、TSDB、HDFS、Solr、Kafka等多种标准接口和无缝集成三方生态工具。作为云原生多模数据库,Lindorm是日志、监控、广告、出行、社交、风控等场景的首选数据库,也逐渐成为互联网、车联网、制造、金融等领域头部客户的首选。

本次比赛以 Lindorm 服务新能源汽车行业的数字化转型为背景,参赛者需要基于指定代码工程设计并实现一个简易版的数据库存储引擎,用于实现对海量新能源汽车上报的数据进行高效读写与存储。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值