资源放送&问答集锦丨数据库运维智能化和数字化的实践与探索 —— 2022数据库大咖讲坛(第二期)...

2022数据库大咖讲坛第二期活动已于5月27日圆满结束啦!但学习还未停止!小编为大家整理好了直播的视频回放演讲PPT精彩问答大放送!让我们一起回顾下吧~

3da9628f6d86b519f46f9f36432012c2.png

22a1c49f1babfa35a1c853e65d48700d.png

MySQL Router & MGR构建数据库智能化高可用架构

叶金荣

万里数据库开源生态负责人

PPT下载:https://www.modb.pro/doc/63855

66ac3cd20314566e049fad5ca6783016.png

基于WaaS框架的智能诊断 -- 如何提前发现并解决Oracle影响业务稳定的致命问题

巩飞

云和恩墨数据库云管平台产品总经理

PPT下载:https://www.modb.pro/doc/63873

2b113207b785217c2d51b52728ae8338.png

当规模化运维跨界AI实现数据库自治

王建超

蚂蚁集团高级技术专家

PPT下载:https://www.modb.pro/doc/63869

1cf458a856b24cea0b1f4929c22d2a15.png

openGauss:自驾驶数据库内核

李士福

华为数据库技术专家

PPT下载:https://www.modb.pro/doc/63912

2022大咖讲坛(第二期)视频回放地址:https://www.modb.pro/course/145(复制链接至浏览器或点击文末“阅读原文”观看)

outside_default.png

Q&A

outside_default.png

1

InnoDB Cluster在出现大事事务超过配置事务大小报错后,是否有办法查到执行失败的事务相关SQL语句?

MGR中默认最大事务150M,超过就会报错,上限是2G。

查询执行失败的事务相关SQL语句有以下几个思路:

1.可以找找这些大事务出现的规律,在那个时段临时开启general log,记录下来。

2.在应用端记录这些大事务失败的情况。

3.既然是大事务,运行时间通常也会比较长,可以通过监控记录下来。

另外,GreatSQL未来计划支持大事务,把上限提高到6G。但是不建议使用大事务,因为会造成MGR的延迟。

2

磁盘空间爆满时,GreatDB MGR是怎么处理的?

当磁盘空间满的时候,MySQL社区版MGR会被hang住,这时只能只读,无法提交写事务。

GreatSQL中,发现有节点磁盘满了,会及时将其踢出MGR,等待清理完毕后再重新加回即可,可以避免被整体hang住的风险。

3

怎么解决磁盘损坏修复问题?

根本办法还是要靠冗余,包括设备冗余(构建raid)、冗余节点(主从、MGR架构),以及数据冗余(即备份)。有充分的冗余措施后,就不担心磁盘损坏问题了,直接用冗余数据替换即可。

4

智能诊断目前除了Oracle以外,还对哪些数据库诊断得比较好?

除了Oracle的智能诊断已经发布并且在大量企业商用外,MySQL、PostgreSQL、达梦等开源数据库、国产数据库的智能诊断也正在研发测试中。

5

zCloud的智能诊断可以判断数据库运行环境的问题吗?比如服务器、网络的问题。

可以的。为了全面的智能效果,是必须覆盖服务器、网络、存储链路等关键环境的。如本次分享中的“Oracle 会话阻塞 诊断案例”就包含有网络环境问题诊断。

6

zCloud的智能诊断能力是动态进化的吗?还是固化在软件版本里的?

智能诊断是存在于软件版本里的,但其可以随着运行动态进化,只是目前动态进行的能力稍弱,很多情况下还需要人工专家的协助,才能有最佳的进化效果。

7

我理解智能化本质上还是依赖于专家经验,那么对于越来越多的国产数据库,专家经验也没有那么多的积累,那么如何保持智能化的持续演进呢?

一方面,专家经验是智能化的重要输入,但绝不是智能化的全部。如本次分享中讲到的,智能化=专家系统(专家经验、算法)+AI系统(数据、算法)。另一方面,2020年时,国内市场,非国产数据库占有率下降至52.6%,国产数据库占有率上升至47.4%,这些数据说明国产数据库已经大量运用于各行各业,是有大量经验积累的。

8

蚂蚁DB运维产品支持哪些数据库?

PaaS基础产品的监控告警变更等支持OceanBase、MySQL、Oracle和其他NoSQL数据库如etcd、redis等;智能运维产品主要支持OceanBase和OBKV,比如像分享提到的Tars,但是PaaS基础产品支持MySQL和Oracle等宕机自愈、SQL限流等简单的自愈能力。

9

存量的SQL和增量的SQL是怎么收集起来的?

SQL的捕获主要看数据库集群上部署agent进行实时采集,将所有SQL流量、执行计划、统计信息、Schema信息等采集上来,然后消费程序进行异步消费,对每个SQL请求、执行计划进行诊断,产出诊断结果。增量SQL就是业务研发流程里代码在MR的时候如果有SQL变更的话,会对Diff的SQL进行review。

10

决策下发的时候的时候会做哪些控制呢?

决策的时候会做幂等和免疫控制,比如阻住重复下发、单次下发不会影响或少影响以后其他,在索引自动演进过程中,由中心决策器对Workload里对应表上的top级SQL+long SQL进行综合决策,防止索引膨胀,然后通过仿真验证逐级上线,上线过程中通过SPM逐步引流的能力在逐步切换,并且评估效果是否会自动回滚至前置状态,保障新增索引的稳定过渡。

11

OceanBase使用docker和Kubernetes调度管理吗?

我们的数据库是阿里自研的容器调度管理服务,叫做sigma,跟k8s比较像,但是在安全容器、容器隔离、调度等上做了很多定制化的功能。

12

DB4AI部分用的算法库是MADlib,MADlib属于数据库原生算子吗?

openGauss DB4AI在演进中采用两个方案,2.0之前使用MADlib兼容方案,3.0使用库内原生AI引擎方案,后面以库内原生引擎演进为主,原生算子在3.0内,MADlib不属于数据库原生算子。

13

基数估计的AI算法在面临增量数据时如何处理,重新训练模型吗?

基数估计的模型训练采用两种方式,一种是直接训练模式,即当前无响应字段模型或者用户触发训练模型时采用;另一种是增量训练,即已经有模型,后台会基于增量数据进行迁移学习方式实现。

14

找最小代价使用遗传算法是怎么做的?

计划生成当前无替代遗传算法的计划,最小代价指平衡采用custom plan和global plan选择代价,尽可能代价最小情况下给出准确计划。

04e183b674cb49c54400e28723699bbc.png大家可以私信您感兴趣的话题和想见到的大咖到公众号后台,说不定下一期的活动就有机会实现啦!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值