白鳝经验谈,解DBA疑难之惑

\


在10月27日子衿技术团队首席架构师白鳝(徐戟)老师带来的分享中,DBA+各城市群的群友们都受益匪浅,纷纷点赞,同时也围绕其分享的主题以及作为DBA的职业规划困惑,向白鳝老师提出了不少问题。以下精选出一部分,由白鳝老师根据资深从业经验亲自解答。

 

   

Q1:您IT基础架构方面是怎么去专攻的呢?作为一名数据库的从业人员,如果往架构师方向发展,需要积累哪些能力?

 

白鳝:IT架构需要广泛接触,这个和平台有关。如果你所处的平台接触外面的机会少,那是很难有快速发展的。先要广,一专多能。一专是前提,才有多能,广而不精也不行。数据库精其实是一个十分好的点,因为数据库和IT基础架构的各个方面都有关联。

   

 

   

Q2:您认为DBA最后的出路在哪里?

 

白鳝:如果做技术的话,DBA往往会往架构师方面发展,因为DBA和IT基础架构的各个方面关系都十分紧密;当然也有一些DBA最后去做IT技术管理了,比如牛新庄现在是民生IT部的老大,这也是DBA的好榜样。其实在《DBA的思想天空》里也探讨过这个问题,有几个出路:1、在某个技术方向上做精,有一定的特色,也就是人无我有,人有我精;2、争取往IT管理岗位转型;3、往架构师方面转型;4、往业务专家方面转型;5、转向全能型选手。我这行干了20多年了,从软件开发到DBA、到Oracle优化、到系统优化,再到IT架构师。

   

 

   

Q3:测试环境的搭建都要考虑什么?毕竟测试和生产硬件配置不一致,而且如果数据量很大的话,也不可能都在测试环境还原一下吧?

 

白鳝:这个和测试的内容有关,1:1的测试环境当然是最好的,不过往往在优化工作中很难做到。如果有1:1的环境,SPA做分析,可以得到最佳的模拟效果。但是在条件不具备的情况下,能够导入数据,进行一些类比似的仿真测试。比如这个项目中,在测试环境中测试季度分区和月度分区的性能差异。

   

 

   

Q4:数据库的性能可以看一些AWR的值来计算,那么单论存储来说,怎么看存储的性能?看什么参数?值越大存储性能越好吗?在您分享的案例中所说的一些存储相关的参数值比如磁盘IO的响应时间都是怎么计算出来的呢?系统上是从sar、iostat这样的命令计算的吗?能否从Oracle数据库层面和从OS层面、存储监控层面举例说明一下怎么看磁盘IO性能?

 

白鳝:AWR里面有随机读写,顺序读写的相应时间,有LOG FILE PARALLEL WRITE的指标,这些都是很重要的IO性能指标。在IO相关小节,也有IO的负载情况,这些都是十分有价值的。在OS层面,通过sar –d,iostat,glance等命令可以观察OS层面的IO情况。

   

 

   

Q5:想知道sar那个监控命令怎么写的?或者说有什么磁盘性能的监控方式?db的磁盘性能响应多快才算正常?

 

白鳝:sar -d,iostat 这些命令都可以用来分析IO性能,各个操作系统会略有不同。如果没有性能问题,传统存储的随机读写响应时间在4毫秒左右。当然如果CACHE够大,数据够集中,可能这个指标是1-2毫秒,甚至更低。

   

 

   

Q6:优化的步骤里,为什么存储cache的调整要放到最后调整,中间隔了些时间,而不是一气呵成?

 

白鳝:风险控制,当时也是因为存储工程师没在现场,调整怕出问题没有高手能解决。每个客户的停机窗口都是有要求的,这个客户只有周末才能实施。

   

 

   

Q7:多少盘跟cache跟最大io能力这个怎么换算?

 

白鳝:最简单的折算方法,比如一个15000 RPM的SAS盘,IOPS是150-200,100块盘是15000,CACHE命中率是70%,那么IOPS是多少,大家都算得出吧?【Cache就直接读存储cache意思15000只是30%,那IOPS最大可以到50000咯?】是的。【50000就是这个存储的极限。请教当前系统的IOPS用什么看最为准确?】大体就是这样估算。从Oracle层面和从OS层面、存储监控层面看到的IOPS可能会有差异,OS层面的精确度更高一些。但是我们经常是集中式存储,存储监控看到的是一个整体的情况,看不出某个系统的情况(部分高端也可以看),所以很多情况下,通过OS来看。nmon也是不错的工具,包括glance,osw。

   

 

   

Q8:小弟最近研究Oracle公有云、私有云较多,感觉建设和管理数据库云、中间件云必然会成为DBA未来工作职责的一部分。也就是说,DBA的工作职能在云时代的驱动下,将会发生巨大的改变,请问这个白总怎么看?

 

白鳝:在云时代下,光靠人力是不行的,要加大自动化运维手段的建设。青云在广州的数据中心,没有专职的运维人员,几百台服务器的规模,靠的是自动化运维工具。一个人管几百台机器现在很常见,网上有不少青云机器人的资料,看看会有些启发的,这个不简单是一些监控工具的问题,而是运维自动化社区。自动化运维今后的需求会越来越大,APM工具大家也关注一下。

本文来自云栖社区合作伙伴"DBAplus",原文发布时间:2015-10-29



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
DBA日记 序 3 前言之DBA的性格 7 前言之我的成长之路 11 第一部(1) 5月11日 20 第一部 (2) 5月12日 22 第一部 (3) 5月13日 24 第一部 (4) 5月14日 26 第一部 (5) 5月15日 28 第一部 (6) 5月18日 31 第一部 (7) 5月19日 南京 33 第一部(8) 5月20日 临晨的邮件通知短信 37 第一部(9) 5月22日 ODS系统和RAC 39 第一部(10) 5月23日 实时ODS 41 第一部 (11) 5月24日 重返沈阳 44 第一部(12) 5月25日 46 第一部(13) 5月26 优化方案 48 第一部(14) 5月27日 无奈 50 第一部(15) 5月29 突破困局 52 第一部(16) 5月31日 实施优化 54 第一部(17) 6月6日 实施优化 56 第一部(18) 6月7日 突发事件 58 第一部(19) 6月10日 性能问题 60 第一部(20) 6月11日 例会 62 第一部(21) 6月12日 64 第一部(22) 6月13日 演戏 66 第一部(23) 6月14日 转机 68 第一部(24) 6月14日之二 cache buffer chains 72 第一部(25) 6月15日 青岛 74 第一部(26)之二 6月15日 青岛 78 第一部(27) 6月16日 青岛机场 80 第一部 (28) 6月17日 完美的效果 85 第一部 (29) 6月18日 准备收工 88 第一部(30) 6月19日 突然事件 90 第一部(31) 7月20日 重回沈阳 92 第一部(32) 7月21日 课堂风波 95 第一部(33) 7月23 世博园一日游和心想事成 98 第一部 7月23日夜 漫长的一夜 (第一部完) 101 后记1 结束语 108 后记2 优化项目的流程之方案 109

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值