glusterfs modify time(mime) 修改时间不一致问题分析

环境:版本 3.3git 分布-复制卷

现象:如果某个复制集合的某个文件的两个副本modify time 时间不一致。在客户端ls/stat 某个文件,返回的modify time不一致。根据设置不同,出现不一致的几率也有所不同。

分析:



一 复现方法:
去掉所有中间xl,即在fuse-bridge和afr中间的不必要的软件组件比如md-cache/quick-read等。在3.3git上复现 ,并探测分析。
保证两个相同文件mtime不同,drop内核缓存就保证了问题的必然重现。


模块层级关系:
stat 用户空间----syscall-----vfs----fuse module-----fuse 用户空间 fuse bridge--mdcache。。。。-dht ---afr 



二  代码路径:
用户空间stat操作通过内核vfs_fstatat调用,其首先要lookup(vfs或者并fuse lookup(内核)) ,然后vfs_getattr(直接传递到fuse内核那)。

stat具体的路径分两种,我们不考虑内核缓存的影响。两种路径,都会出现mtime不一致的情况。


A,
      首先要到内核fuselookup--afr-lookup,然后内核vfs_getattr---内核fuse_getattr---在这个函数内就直接使用了刚才lookup返回的某个好child(复制集合的里的好子卷)的inode的buf(iattr inode 属性)。


本质:是通过用户空间fuse_lookup直接返回给用户的。
B,
     首先要到内核fuselookup--afr-lookup,然后内核vfs_getattr---内核fuse_getattr---在这个函数内要调用到用户空间,最终要调用afr_stat(在复制集合内,afr_stat只需向一个child发送,而lookup必须所有child)。
  afr_stat用的是刚才lookup返回的的某个好child(复制集合的里的好子卷)id。并继续往下层发送去获取inode buf(iattr inode 属性),这与路径1的方法不同。


本质:通过lookup找到一些好的child,然后afr_stat就利用其中一个child,并往下发送去获取inode but,不需要原来lookup返回的buf。


三  问题解决

两种情况都得考虑。

具体略。




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值