nouveau未禁用导致Ubuntu rsyslogd频繁写系统日志CPU占用率高的问题

        最近在使用Ubuntu14.04服务器时遇到一个如下问题。 服务器开机后,发现rsyslogd服务占用率一直为100%,查看日志发现才开机的几分钟的时间,刚清空的syslog已经有了几个G。

 

 由于文件过大,无法通过cat命令查看,所以通过如下命令查看日志内容:

tail -f /var/log/kern.log

 日志内容大致如下:

Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.903969] nouveau 0000:03:00.0: gr: 502000 - stat 80000000 00006500 00000000 00000000
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.903973] nouveau 0000:03:00.0: gr: 502000 - stat 00000000 00000000 00000002 00000000
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.903981] nouveau 0000:03:00.0: gr: FECS ucode error 2
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.903982] nouveau 0000:03:00.0: gr: FECS 00000003
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.903984] nouveau 0000:03:00.0: gr: 409000 - done 00000340
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.903988] nouveau 0000:03:00.0: gr: 409000 - stat 80000000 00010f00 80011698 80011698
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.903992] nouveau 0000:03:00.0: gr: 409000 - stat 00001000 00000002 00000006 00000000
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.903994] nouveau 0000:03:00.0: gr: 502000 - done 00000300
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.903998] nouveau 0000:03:00.0: gr: 502000 - stat 80000000 00006500 00000000 00000000
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.904002] nouveau 0000:03:00.0: gr: 502000 - stat 00000000 00000000 00000002 00000000
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.904011] nouveau 0000:03:00.0: gr: FECS MTHD subc 1 class 80011698 mthd 1698 data 00001000
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.904013] nouveau 0000:03:00.0: gr: FECS 00000002
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.904015] nouveau 0000:03:00.0: gr: 409000 - done 00000340
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.904019] nouveau 0000:03:00.0: gr: 409000 - stat 80000000 00010f00 80011698 80011698
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.904022] nouveau 0000:03:00.0: gr: 409000 - stat 00001000 00000002 00000006 00000001
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.904024] nouveau 0000:03:00.0: gr: 502000 - done 00000300
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.904028] nouveau 0000:03:00.0: gr: 502000 - stat 80000000 00006500 00000000 00000000
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.904032] nouveau 0000:03:00.0: gr: 502000 - stat 00000000 00000000 00000002 00000000
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.904042] nouveau 0000:03:00.0: gr: FECS MTHD subc 1 class 80011698 mthd 1698 data 00001000
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.904043] nouveau 0000:03:00.0: gr: FECS 00000002
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.904046] nouveau 0000:03:00.0: gr: 409000 - done 00000340
Mar 15 11:09:45 lango-smallserver-002 kernel: [  408.904049] nouveau 0000:03:00.0: gr: 409000 - stat 80000000 00010f00 80011698 80011698

将rsyslogd杀掉后不久,就发现kworker 进程的cpu占用率一直为100%左右,而且这个进程还干不掉,干掉了又会自己运行。

而且发现通过reboot 、shutdown等命令没法关机。

 

查询到这个kworker进程的cpu占用高是由于bios配置、驱动匹配,或者频繁的系统调用导致。于是一项项排除:

1. 先重启了机器,发现还是会出现该问题,频繁的系统调用应改不会有,机器中毒的可能性也不大。

2. 重置了bios配置,问题依然存在。

3. 最后根据日志中的nouveau 关键字搜索发现:

大致原因是由于安装NVIDIA驱动后,没有禁用nouveau导致,总之这个锅交给了N卡。

首先看看nouveau 这是个什么东西:

在网上查看解决办法:

https://www.zhihu.com/question/68565667?sort=created

 

解决办法:

把驱动加到黑名单里面去即可,在 /etc/modprobe.d/blcaklist.conf 文件末尾添加:

然后执行如下命令: 

sudo update-initramfs -c

sudo update-grub

sudo reboot

如果通过命令重启不了,自己强制重启系统即可。
 

智能网联汽车的安全员高级考试涉及多个方面的专业知识,包括但不限于自动驾驶技术原理、车辆传感器融合、网络安全防护以及法律法规等内容。以下是针对该主题的一些核心知识点解析: ### 关于智能网联车安全员高级考试的核心内容 #### 1. 自动驾驶分级标准 国际自动机工程师学会(SAE International)定义了六个级别的自动驾驶等级,从L0到L5[^1]。其中,L3及以上级别需要安全员具备更高的应急处理能力。 #### 2. 车辆感知系统的组成与功能 智能网联车通常配备多种传感器,如激光雷达、毫米波雷达、摄像头超声波传感器等。这些设备协同工作以实现环境感知、障碍物检测等功能[^2]。 #### 3. 数据通信与网络安全 智能网联车依赖V2X(Vehicle-to-Everything)技术进行数据交换,在此过程中需防范潜在的网络攻击风险,例如中间人攻击或恶意软件入侵[^3]。 #### 4. 法律法规要求 不同国家地区对于无人驾驶测试及运营有着严格的规定,考生应熟悉当地交通法典中有关自动化驾驶部分的具体条款[^4]。 ```python # 示例代码:模拟简单决策逻辑 def decide_action(sensor_data): if sensor_data['obstacle'] and not sensor_data['emergency']: return 'slow_down' elif sensor_data['pedestrian_crossing']: return 'stop_and_yield' else: return 'continue_driving' example_input = {'obstacle': True, 'emergency': False, 'pedestrian_crossing': False} action = decide_action(example_input) print(f"Action to take: {action}") ``` 需要注意的是,“橙点同学”作为特定平台上的学习资源名称,并不提供官方认证的标准答案集;建议通过正规渠道获取教材并参加培训课程来准备此类资格认证考试。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值