SCSI代码分析（7）SCSI错误处理（续）

最新推荐文章于 2022-03-31 10:05:57 发布

linux解码者

最新推荐文章于 2022-03-31 10:05:57 发布

阅读量1.4k

点赞数 1

分类专栏： BLOCK_SCSI 文章标签： scsi错误处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/flyingnosky/article/details/121843761

版权

BLOCK_SCSI 专栏收录该内容

24 篇文章 87 订阅

订阅专栏

当前Linux SCSI层的错误处理机制在遇到问题时会阻塞整个SCSI主机上的所有IO，导致服务暂停。提出一种可能的优化方案，即改为基于SCSI设备的错误处理，通过为每个磁盘创建独立的错误处理线程，仅阻塞出错磁盘的IO，以减少对正常磁盘的影响。在无法通过设备级恢复操作解决问题时，再升级到阻塞主机级别进行更高级别的恢复操作。该想法有待进一步研究和实现。

摘要由CSDN通过智能技术生成

当前LINUX社区SCSI层错误处理在整个错误处理期间是阻塞整个SCSI HOST上所有的IO的，也就是即使仅某个盘的IO出错，在错误处理阶段会阻塞所有的盘的IO(即使其他的盘都是正常的)，会造成业务的暂时停顿，这是目前SCSI错误处理存在经常让人诟病的问题。

分析完SCSI层的错误处理，个人认为可能可以优化，将基于SCSI HOST的错误处理变为基于SCSI DEVICE的错误处理（即尽可能只阻塞SCSI DEVICE的IO，而不是直接阻塞SCSI HOST的IO）：

对每个盘单独创建一个错误处理线程，处理本盘的错误处理，当本盘出错时，仅阻塞本盘的IO，不影响其他盘的运行；
每个盘的错误处理中，恢复操作流程仍为：abort某个IO，若失败，对盘执行recover_lun/I_T_nexus_reset等恢复操作（SCSI DEVICE part恢复操作），若这些操作无法恢复错误，说明不仅仅是本盘的问题，升级到阻塞HOST上所有IO，待整个HOST所有IO状态明确后，进入SCSI HOS part恢复操作（控制器复位等）。

目前只是初步考虑认为可行，真正实施修改需要考虑的细节应该有很多，待有时间再尝试。

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
SCSI代码分析（7）SCSI错误处理（续）

当前LINUX社区SCSI层错误处理在整个错误处理期间是阻塞整个SCSI HOST上所有的IO的，也就是即使仅某个盘的IO出错，在错误处理阶段会阻塞所有的盘的IO(即使其他的盘都是正常的)，会造成业务的暂时停顿，这是目前SCSI错误处理存在经常让人诟病的问题。分析完SCSI层的错误处理，个人认为可能可以优化，将基于SCSI HOST的错误处理变为基于SCSI DEVICE的错误处理（即尽可能只阻塞SCSI DEVICE的IO，而不是直接阻塞SCSI HOST的IO）：...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。