六六哥的博客

Linux内核,虚拟化,云计算

声明 & 推荐博客[置顶]

因网易私加广告,搬家至CSDN,但有些博客图片未搬迁成功,如有需要请参考原博客 原博客为网易博客,地址为 blog.163.com/eric_liufeng.

2015-09-28 09:57:41

阅读数 1095

评论数 1

Intel的instruction boundaries是什么

今天看SDM发现一个关键的名词交错"instruction boundaries"经常出现. 如"All interrupts are guaranteed to be taken on an instruction boundary". 那么什么是指令的边...

2015-09-30 14:24:35

阅读数 846

评论数 0

Cacheline技术浅析

最近组内有个同事在做cacheline相关的特性,向其学习了一下,对原来的cacheline的理解更近了一步。这里总结一下。请彭超大侠有空的话帮忙在斧正一下 Cache就是对内存的内容进行缓存的一个硬件。cache和内存的逻辑关系结构如下图所示。从左往右,从上到下逐个说明 ...

2015-09-29 11:23:42

阅读数 9705

评论数 0

Intel MCE 之增强的CACHE ERROR REPORTING

从Intel Core Duo开始,开始引入了 cache error reporting的增强版本。在早期的Intel芯片中,cache的状态取决于一个cache中发生错误纠正事件的次数。在一个叫做 “threshold-based error status”的规范中指出,cache的状态现在...

2015-09-29 09:33:54

阅读数 710

评论数 0

Intel MACHINE-CHECK 特性的初始化伪代码实现

如果要使用MCA,首先要初始化芯片来激活 machine-check exception和 error-reporting机制 下面给出的伪代码中展示了如何完成MCA的初始化动作。本代码首先检测MCA和exception是否被芯片支持;然后使能 machine-check excep...

2015-09-29 08:20:15

阅读数 743

评论数 0

Intel MCE UCR ERRORS(三) UCR的错误分类

通过 IA32_MCi_STATUS中的S和AR两位的不同编码,可以将UCR分为如下类别 Uncorrected no action required (UCNA) - 该类UCR不会通过MCE进行通知,而是按照 corrected machine check error的方式报告...

2015-09-28 14:21:52

阅读数 950

评论数 0

Intel MCE UCR ERRORS(二) UCR的报告和记录

IA32_MCi_STATUS MSR 用来报告UCR错误、 corrected错误和 uncorrected errors错误。 IA32_MCi_STATUS的定义如下所示,通过其中的bit位可以唯一的标明UCR错误。 根据UCR的错误类型,UCR错误可以通...

2015-09-28 13:44:57

阅读数 772

评论数 0

Intel MCE UCR ERRORS(一) 概述

UCR( uncorrected recoverable machine check errors) 错误恢复是MCA的一种增强特性,第一个支持该特性的芯片是Intel的45nm芯片(CPUID为 DisplayFamily_DisplayModel: 06H_2EH)。该特性允许系统软件对于特...

2015-09-28 10:52:25

阅读数 762

评论数 0

Intel MCE CMCI (三) 系统软件中CMCI的相关实现

系统软件必须负责使能CMCI,并能管理CMCI。系统软件在相关的逻辑CPU上需要设定CMCI的中断处理程序,可以对CMCI LVT进行编程,并且可以串行的查询被多个处理器共享的 machine check banks 本文将讲述系统软件如何管理CMCI,包括:CMCI的初始化,中断处理函数(如...

2015-09-28 10:08:42

阅读数 843

评论数 0

Intel MCE CMCI (二) CMCI的LAPIC接口

CMCI的操作图如下所示 CMCI中断的传送被配置向为LAPIC寄存器空间中的 LVT CMCI写入,该寄存器默认的起始地址为 APIC_BASE + 2F0H。如果 MC errors影响到了多个逻辑处理器,那么CMCI就会被传递到多个逻辑处理器上。例如,两个逻辑处理器共享一个cac...

2015-09-28 10:06:56

阅读数 675

评论数 0

Intel MCE CMCI (一) 概述

Corrected machine-check error interrupt (CMCI) 是MCA的增强特性。在原来的芯片里面,都是使用一种叫做 threshold-based error reporting的机制来处理corrected error. 但是threshold-based e...

2015-09-28 10:05:07

阅读数 844

评论数 0

MACHINE-CHECK 相关的MSR(二) - Machine-Check 全局控制MSR

Machine-Check 全局控制MSR包括:IA32_MCG_CAP, IA32_MCG_STATUS,IA32_MCG_CAP, IA32_MCG_STATUS。其中后两个是可选的1.  IA32_MCG_CAP MSRIA32_MCG_CAP是一个只读寄存器,其中报告了当前芯片MCA相关的...

2015-09-28 09:57:33

阅读数 951

评论数 0

MACHINE-CHECK 相关的MSR(一) - 概述

Machine check使用了一组相关的MSR。这些MSR有两部分组成,第一部分是全局控制和状态寄存器(global),另外一部分是一些记录错误信息的banks(banks的概念在前面的文章已经讲过,请看参考文章)。MSR的整体布局如下图所示 每一个错误报告的bank都同处理器中一个特定的硬件单...

2015-09-28 09:57:31

阅读数 799

评论数 0

Intel MCA 硬件机制概述

Intel引入了  MACHINE-CHECK ARCHITECTURE(MCA) 和 machine-check exception(#MC) 机制用来对服务器硬件进行自检,并在发现硬件错误的时候发出中断或异常。系统软件收到中断或异常后,会对其进行响应,进行相应的修复、告警或其他策略等动作。通过...

2015-09-28 09:57:28

阅读数 2890

评论数 0

内核虚拟地址转物理地址的函数

内核虚拟地址转换物理地址的函数为pa = __pa(va);

2015-09-28 09:57:25

阅读数 556

评论数 0

Native Linux的MCE基本原理和处理函数入口(基于kernel 4.2.0+ )

在老的Intel处理器上,当硬件检测到错误后,就会对系统的每个逻辑CPU广播MCE. 这样设计是因为硬件上的缺陷,因为原来的处理器当发现了错误(如内存错误),是会随着pipeline流到任意的不可预测的CPU上去,导致系统的问题.基于这样的硬件设计问题,就产生了将MCE广播到整个系统所有CPU上去...

2015-09-28 09:57:23

阅读数 931

评论数 0

Intel UCE和CE,以及register banks的意思

最近阅读intel SDM的RAS部分的时候,遇到了一些名字难以理解,找到了相关的高手询问得到了答案,这里共享出来CE: corrected error。意思就是可矫正的错误。举个例子来说,当内存检查遇到了错误的时候,当检查到的错误是1bit的时候,可能就是因为ECC校验码错误导致的,这时候CPU...

2015-09-28 09:57:20

阅读数 1776

评论数 0

实验室服务器串口配置

1. UEFI安装,所以启动文件的配置为/boot/efi/EFI/redhat/grub.cfg,或者直接修改/etc/grub2-efi.cfg2. 修改启动启动参数,添加如下参数:console=tty0 console=ttyS0,115200 并且去掉quite参数3. 通过consol...

2015-09-28 09:57:17

阅读数 513

评论数 0

Intel处理器中断18 - Machine-Check Exception (#MC)介绍

概述当处理器探测到机器内部错误或者总线错误的时候,就会发送该中断。当然,一个外部的硬件代理设备探测到总线错误的时候,也会发送该中断。近期的工作是围绕内存错误的,所以发现了内存 错误,就会对处理器发送该中断。machine-check exception 在Pentium以后的芯片上才得以支持,而且...

2015-09-28 09:57:15

阅读数 4478

评论数 0

X86服务器配置YUM源的方法

#拷贝数据包mkdir /opt/repomount -o loop /dev/cdrom /opt/repocp /mnt/Packages/* /opt/repo#安装三个数据包cd /opt/reporpm -ivh deltarpm-3.6-3.el7.x86_64.rpm rpm -iv...

2015-09-28 09:57:12

阅读数 509

评论数 0

提示
确定要删除当前文章?
取消 删除