linux mce的一些相关内容和用户态监控的设计方法

生活需要深度

于 2023-03-17 14:32:46 发布

阅读量305

点赞数

文章标签： linux 运维服务器 MCE

本文链接：https://blog.csdn.net/u012294613/article/details/129620213

版权

27 篇文章 8 订阅

订阅专栏

之所以想起写一点关于mce的东西，倒不是因为遇到mce的异常了，之前遇到过很多mce的异常，内存居多，但没有好好记录下来，写这个是因为参加2018 clk南京会议的一点想法。

其中mce的初始化流程为：

Start_kernel-->check_bugs-->identify_boot_cpu-->identify_cpu-->mcheck_cpu_init

如果为了调试mce功能，模拟硬件真的出问题，那么可以使用 mce-inject 用户态工具来实现，对应内核的函数为：

当然调试的时候，一般需要修改tolerant 值，不然有可能引起复位：

cat /sys/devices/system/machinecheck/machinecheck15/tolerant
[root@centos7 ~]#
[root@centos7 ~]# ls -alrt /sys/devices/system/machinecheck/machinecheck15/tolerant
-rw-r--r--. root root 10月 : /sys/devices/system/machinecheck/machinecheck15/tolerant
[root@centos7 ~]# echo > /sys/devices/system/machinecheck/machinecheck15/tolerant
[root@centos7 ~]# cat /sys/devices/system/machinecheck/machinecheck15/tolerant
/*
* Tolerant levels:
* 0: always panic on uncorrected errors, log corrected errors
* 1: panic or SIGBUS on uncorrected errors, log corrected errors
* 2: SIGBUS or log uncorrected errors (if possible), log corr. errors
* 3: never panic or SIGBUS, log all errors (for testing only)
*/

下面描述的是引发思考的过程，即mce的通知机制，为什么突然想写mce的机制，是因为其实它应用的模式可以解签，

我们把内核维护mce数据的方式视为mce数据的生产者，而用户态取该数据视为消费者的话，生产消费模型非常明显，针对这种模型，一般由两种方式来处理：

1.轮询，

2.中断通知

其中中断通知又可以细分为有守护进程，即daemon 方式，还有一种是无守护进程，直接回调一个trigger的方式。

上面这个例子就是daemon方式，等待在poll中，等内核事件通知。

等待的文件名是/dev/mcelog：

那么，既然是sys文件系统，肯定有对应的read和write来提供给用户使用，read显而易见，是读取mce日志，write是干啥的？其实这里的write主要就是为了给别人注册用的，mce本身不是

调用write来写数据，它直接维护一个数据区，等别人来读，另外daemon是使用poll方法来等待的，所以自然还得实现poll方法：

poll方法的最终实现：

既然有等待队列，自然而然就会想，我什么时候唤醒：

既然mce的来源有用户调试，以及真实检测，所以很自然唤醒也有多个来源。比如inject来唤醒和mce真实中断唤醒。

用户进程被poll唤醒之后，一般是poll_in，自然需要去读取数据，直接调用read方法就行。也就是一个简单的read和poll，就解决了监控用户态侧的大部分功能。

其他信息就不一一列了，昨天参加clk南京的会议，其中富士通一个兄弟说他们实现了NVDIMM 的一个监控，原因在于他们认为NVDIMM 是很难replace，所有有必要监控它。

它列出了一个模型，就是用户态daemon，然后设置filter到内核，内核将其监控到的event发给等待的用户进程，使用的方法正是triggers a poll event ，和目前的mce有异曲同工之妙。

假设让你设计这种监控类的东西，你会怎么设计呢？

关注