问题:硬盘问题导致集群执行效率变慢
问题现象 :集群执行效率整体变慢。
原因分析 :通过 gnode 层的 show processlist 看,发现一个节点 sql 任务特别多,执行时 间较长。怀疑这个节点的硬件有问题。 同时通过 nmon 观察这个节点的 I/O 使用率 100%,而硬盘的读写效率只有 10 M/S 左右。 通过观察 pstack 有多个线程在执行 fdatasync()。 以上可以确定这台机器的硬盘有问题。可以通过 dd block size 4k–1m 进行测试, 来验证问题。