• 博客(140)
  • 收藏
  • 关注

原创 银河麒麟服务器操作系统IO机制详解

在 Linux 系统中,传统的访问方式是通过 write() 和 read() 两个系统调用实现的,通过 read() 函数读取文件到到缓存区中,然后通过 write() 方法把缓存中的数据输出到文件。以 BufferIO 为例(与之对应的是 DirectIO,不读写 PageCache),当应用程序执行 read 系统调用读取一块数据的时候,如果这块数据已经存在于用户进程的页内存中,就直接从内存中读取数据。

2026-03-13 14:26:05 410

原创 大页内存与透明大页内存区别

本文介绍了Linux系统中的两种大页技术:标准大页(HugePages)和透明大页(THP)。标准大页需要预分配,能减少页表项、提升性能,但存在内存碎片化、配置复杂等问题;透明大页可动态分配,自动化程度高,但可能增加内存消耗并导致性能下降。文章详细对比了两者的优缺点,并提供了开启/关闭的具体操作方法。最后指出,虽然透明大页简化了使用,但在数据库等场景下建议关闭以获得更稳定的性能。

2026-03-13 10:11:36 414

原创 vm.swappiness 参数设置及优化指南

本文档详细介绍了银河麒麟高级服务器操作系统中/proc/sys/vm/swappiness参数的作用及配置方法。该参数控制内存交换倾向,取值范围0-100,默认值因版本而异(V10-SP1/2/3为10,V10-SP3-2403为30)。文档提供了临时修改(sysctl命令)和永久修改(编辑/etc/sysctl.conf)两种方法,并给出设置建议:普通服务器推荐10-20,高内存场景可设为5-10,特殊需求可适当调高但避免设为100。强调修改前需评估系统内存使用情况,做好测试备份,以确保系统稳定运行。合理

2026-03-12 16:35:41 370

原创 U盘等存储外设故障排查

本文介绍了排查U盘等存储设备故障的方法,主要包括:1)使用lsblk、lsusb等命令检测设备识别状态;2)通过fsck命令修复文件系统错误;3)利用badblocks检测物理坏块;4)使用dd和hdparm测试读写性能。文档还提供了常见问题的解决方案,如设备未识别时的接口检查、文件系统损坏的修复与格式化操作,以及性能异常的判断标准。最后总结了不同故障的处理建议,帮助用户快速定位和解决存储设备问题。

2026-03-12 14:20:10 409

原创 深入解析文件操作中的常见问题:空洞、传输与大小差异

本文探讨了文件系统操作中的常见现象:通过ls和du命令显示文件大小的差异,以及scp传输后文件大小变化但md5校验值不变的原因。重点分析了稀疏文件(含空洞)的特性,指出ls显示逻辑大小而du显示实际磁盘占用。当使用scp传输稀疏文件时,空洞会被填充为零字节,导致目标文件占用空间增加但内容不变。为保留稀疏特性,建议使用rsync的--sparse参数进行传输。文章强调理解文件系统底层原理对正确处理文件存储和传输问题的重要性,帮助用户根据实际需求选择合适工具。

2026-03-11 15:57:17 365

原创 grub 介绍

本文介绍了GRUB引导程序的基本概念及版本演变。主要内容包括:GRUB是多操作系统启动引导程序,分为GRUB Legacy(0.9x)和GRUB2(1.x+)两个版本。GRUB2进行了全面重构,新增脚本支持、模块化设计等功能,配置文件改为grub.cfg,分区编号从1开始计数。与旧版相比,GRUB2采用自动生成启动菜单、支持更多文件系统等改进,通过update-grub命令更新配置。文档还详细说明了两者在分区编号、配置文件等方面的具体差异。

2026-03-11 15:42:57 386

原创 银河麒麟桌面操作系统(全X86/ARM架构)【快捷键高效应用与自定义指南】

本文档详细介绍了麒麟桌面系统的快捷键使用技巧,包含系统原生快捷键和自定义配置方法。系统原生快捷键涵盖窗口管理(如Win+方向键分屏)、文件操作(F3分屏视图)、工作区切换(Ctrl+Alt+方向键)等实用功能。自定义配置部分提供图形化设置流程、冲突解决方案(如gsettings命令查询占用)以及典型应用场景(快速截图、目录直达等)。所有操作均基于系统原生功能实现,无需第三方工具,帮助用户显著提升操作效率。文档适用于所有麒麟桌面系统用户,通过快捷键的合理配置可优化日常工作流程。

2026-03-11 15:28:12 688

原创 进程资源限制与性能优化实践

本文围绕银河麒麟桌面操作系统V10SP1多任务运行场景下的资源管理痛点,提供进程资源限制与系统性能优化的实操方案。随着办公场景中多应用并发运行需求增加,部分进程过度占用 CPU、内存等资源易导致系统卡顿、响应延迟等问题。本文通过用户级、服务级、进程组级三类资源限制方法,结合 CPU、内存、磁盘 I/O 的针对性优化技巧,帮助用户合理分配系统资源,提升系统稳定性与运行流畅度。

2026-03-11 11:33:56 536

原创 页缓存(Page Cache)原理与运维实践分析

本文深入解析Linux页缓存(PageCache)的核心原理与优化策略。详细介绍了页缓存的三大关键技术机制:数据加载(预读与按需)、缓存淘汰(LRU改进算法)和写缓存(回写与同步)。针对生产环境中常见的三大问题(缓存命中率低、内存被占满、重启后缓存失效),提供了具体的问题分析思路和解决方案。最后给出了基于业务场景的预读优化建议、内核参数调优配置以及监控体系建设方案。全文为运维人员提供了从原理到实践的完整技术参考,帮助实现磁盘I/O性能的最优化。

2026-03-10 17:41:27 521

原创 服务器存储系统原理与运维实践解析

本手册旨在深入解析服务器存储系统的底层架构与核心原理,为运维人员提供系统的存储管理知识体系。编写背景源于生产环境中频繁出现的存储性能瓶颈、文件系统损坏、磁盘故障导致的数据丢失等问题,多数问题根源在于运维人员对存储系统的分层架构、文件系统工作机制及存储IO调度逻辑理解不透彻,导致故障排查效率低、优化措施针对性不足。

2026-03-10 16:47:30 516

原创 IE浏览器内核插件与 Chrome 内核浏览器插件的区别及兼容性分析

本手册旨在详细阐述 IE 浏览器内核插件与 Chrome 内核浏览器插件的核心区别,深入分析 IE 浏览器插件无法在 Chrome 内核浏览器上使用的底层原因。编写背景源于浏览器生态的多元化发展,不同内核浏览器的插件兼容性问题已成为开发者和用户常见的技术痛点。本文将从技术架构、开发标准、运行机制等维度展开说明,为相关技术人员、开发者及用户提供清晰的理论参考,帮助其理解浏览器插件的兼容性本质。

2026-03-10 16:36:55 436

原创 从容器到 Docker 再到 Kubernetes 的进阶之路介绍

本文介绍了容器技术及其生态系统的核心概念。容器作为轻量级、可移植的应用封装单元,解决了环境一致性问题。Docker作为容器化平台,简化了容器的构建和管理。Kubernetes则专注于大规模容器编排,实现自动化部署和运维。三者共同构成现代云原生应用的完整技术栈:容器提供标准化单元,Docker实现单机容器管理,Kubernetes处理集群级调度。文章通过集装箱的比喻,清晰阐述了它们之间的层级关系和协同作用,为理解现代软件部署架构提供了系统性认知。

2025-12-09 17:46:11 985

原创 U 盘等存储外设故障排查

本文介绍了银河麒麟操作系统中排查U盘等存储设备故障的方法。

2025-12-09 14:53:22 1017

原创 LVM 概述与配置命令介绍

本文详细介绍了银河麒麟操作系统中LVM(逻辑卷管理)的使用方法。主要内容包括:1. LVM的基本概念和工作原理,包括物理卷(PV)、卷组(VG)、逻辑卷(LV)等核心组件;2. 常用LVM管理命令,涵盖物理卷、卷组和逻辑卷的创建、查看、修改、删除等操作;3. 文件系统管理,包括创建文件系统、手动/自动挂载等;4. 重点说明了逻辑卷的扩容和缩容操作流程及注意事项,特别强调XFS文件系统不支持在线缩容的特性。文章提供了大量实用命令示例,是银河麒麟系统下磁盘管理的实用参考指南。

2025-12-09 14:14:33 850

原创 grub 介绍

本文介绍了GRUB引导程序的基本概念和版本演进。

2025-12-09 13:54:34 763

原创 具备AI功能的银河麒麟桌面操作系统已正式上市

人工智能的快速发展,不同用户对AI的应用需求差异日益分化,如何让AI成为高效、灵活、安全的生产力成为新课题。银河麒麟桌面操作系统V10 SP1 2503基于自主创新研发的“AI子系统”,凭借其分层架构设计和全面覆盖的AI能力,保护用户个人隐私及数据安全,助力用户智能化办公效率加速升级。银河麒麟桌面操作系统V10 SP1 2503基于自主创新研发的“AI子系统”,凭借其分层架构设计和全面覆盖的AI能力,保护用户个人隐私及数据安全,助力用户智能化办公效率加速升级。“分层架构、灵活高效”是AI子系统的最大特色。

2025-05-15 14:17:59 1424

原创 【银河麒麟高级服务器操作系统】服务器外挂存储ioerror分析及处理分享

这表明设备sdb和sdc发生了I/O错误。另外,日志中还出现了rejecting I/O to offline device的消息(例如:sd 3:0:0:1: rejecting I/O to offline device),这通常意味着设备已经离线,无法再进行I/O操作。sdb和sdc设备应该对应sd 3:0:0:0和sd 3:0:0:1,查看当前收集的sosreport中的lsscsi命令,由于相隔的时间太过久远,没有3:0:0:0和3:0:0:1相关的设备,变为了5:0:0:0和5:0:0:1。

2025-05-08 11:23:59 1778

原创 【银河麒麟高级服务器操作系统】在VMware虚拟机情况下出现软锁处理过程

2、分析时间2的vmcore-dmesg日志,kswapd0在CPU8上尝试回收页面,页面回收涉及过多的TLB刷新操作,可能当时系统环境内存存在压力,页面回收过程中需要同步更新TLB,导致smp_call_function_many被频繁调用,而某些CPU又存在超售,最后导致软锁。从日志中可以看到,这是一次软锁的问题,kswapd0在CPU#8 上,内核态运行时消耗了过多的 CPU 时间,未能及时释放CPU导致其他任务无法运行。查看CPU0上的硬件中断情况,在该CPU并没有硬中断,所以没有出现中断风暴。

2025-04-27 13:50:17 1285

原创 【银河麒麟高级服务器操作系统】磁盘只读问题分析

综合分析,虚拟机系统内部原因可能性很低,虽然虚拟机内部的驱动程序错误或配置问题可能导致I/O问题,但同时影响到两个不同的虚拟磁盘,并且有print_req_error和rasdaemon的硬件错误报告,这种可能性非常之低。问题根源是底层存储的I/O错误,print_req_error和rasdaemon的报警都指向了底层的硬件或存储层面的问题,而且/dev/vda1和/dev/vdb都出现了I/O错误,说明不是单个磁盘或文件系统的问题。// 由于发生了I/O错误,EXT4文件系统中止了其日志操作。

2025-04-24 13:50:33 2024

原创 【银河麒麟操作系统】ptmalloc内存释放原理及优化方案

ptmalloc系统参数的设置,根据现提供业务信息分析,

2025-04-03 10:00:55 1422

原创 【银河麒麟高级服务器操作系统 】虚拟机运行数据库存储异常现象分析及处理全流程

虚拟机部署v10sp2系统,宿主机为欧拉定制系统。虚拟机运行Vastbase数据库软件,在03:10:04数据库执行了对表dwd_rq_jg_xjjl_all_delta_1824281295409119232(对应物理文件11747991)的删除操作,08:00:17数据库将数据写入表t_yh(对应物理文件11749618),在次日08点,读取表t_yh时异常。同时由于虚拟机的数据存储过程涉及到宿主机及网络存储,不排除数据库存在故障,或云平台存储故障,导致数据丢失,还需数据库厂商及云平台厂商进一步排查。

2025-03-28 11:08:43 804

原创 打造智算引擎!银河麒麟智算操作系统是专为AI时代设计的操作系统

传统审校依赖人工逐字核查,千页文档需3-5人日且存在漏检风险(错误率5%),而智慧审校通过优化LTP、ResNet、Diffusion等十大模型,实现千页文档小时级自动化审查,敏感信息识别准确率达99.8%,审校效率提升百倍;依托基于银河麒麟智算操作系统的国产智算底座,保障全链路数据安全,杜绝技术“后门风险”;实现了GPU拓扑感知调度,支持多机多卡拓扑感知调度。,既保证了底层算力的高效供给,又降低了中层AI工程化门槛,还完成上层AI应用的敏捷创新支撑,形成从基础算力到场景价值的完整转化闭环。

2025-03-13 15:21:50 761

原创 【银河麒麟高级服务器操作系统实例】虚拟机桥接网络问题分析及处理

由此可知,由于使用team0(roundrobin )模式,虚拟机arp广播报文,经vnet0进入网桥,此时网桥mac学习到虚拟机的mac地址对应vnet0的port,此时fdb表是正确的。V10SP2系统,使用kvm运行虚拟机,如果是物理机两个网口做成一个team,然后team接网桥,虚拟机再通过这个网桥连接网络,这种方式网络会有问题。实际测试下来,确实会发现网络不通,此时如把team1从网桥删掉,换成物理网口,网络就可以正常使用,单独配置team,也可以正常使用。物理机/虚拟机/云/容器。

2025-03-07 16:28:18 1685

原创 【银河麒麟高级服务器操作系统实际案例分享】数据库资源重启现象分析及处理全过程

更多银河麒麟操作系统产品及技术讨论,欢迎加入银河麒麟操作系统官方论坛了解更多银河麒麟操作系统全新产品,请点击访问麒麟软件产品专区:https://product.kylinos.cn开发者专区:https://developer.kylinos.cn文档中心:https://document.kylinos.cn处理器:整机类型/架构:x86_64【内核版本】【OS镜像版本】

2025-03-04 11:30:58 1099

原创 【银河麒麟高级服务器操作系统】服务器测试业务耗时问题分析及处理全流程分享

对比每个ConsumeMessageT线程cpu使用率,两套环境比较接近,最高都在12%左右,但是统计多个时间点活动的ConsumeMessageT进程数量,hygon_kylin环境中有107-135个,intel_redhat上只有71-105个,猜测cpu使用率可能跟测试程序拉起的ConsumeMessageT线程数有关,具体可能跟测试程序关系更大。针对intel_kylin组合业务耗时特别高的问题,分析1000线程数业务测试具体数据,如下图,copy事务最高耗时达到781s,平均4s多。

2025-02-28 16:56:53 1387

原创 【详细指南】如何在银河麒麟操作系统上使用DeepSeek?

最近国内AI大模型DeepSeek爆火,相信使用银河麒麟操作系统的用户也非常急迫的想体验一把,接下来,一文给大家介绍在银河麒麟操作系统玩转DeepSeek的四种场景!

2025-02-14 17:21:15 5539 3

原创 【银河麒麟高级服务器操作系统】服务器卡死后恢复系统日志丢失-分析及处理全过程

【银河麒麟高级服务器操作系统】服务器卡死后恢复系统日志丢失-分析及处理全过程

2025-02-13 13:57:59 1169

原创 【银河麒麟高级服务器操作系统】系统日志Call trace现象分析及处理全流程

日志中出现的问题表明在这个过程中,内存链表操作发生了损坏,导致内核警告,且伴随提示丢失了40多万行的内核日志信息,记录的情况也已经不是问题的第一现场,出现链表检测错误告警后并不会进行修复,在接下来使用到问题链表时,依旧会出发告警情况。日志系统进行预分配,需要在tmpfs中进行,且伴随内存页的迁移情况,其中伴随page->lru链表的告警的信息输出,由于日志系统存储在tmpfs中,也造成一定的hang住情况,丢失了不少内核信息,也丢失了问题第一现场。分析sa日志,磁盘读写延迟非常高。

2025-02-06 15:27:14 1626

原创 【银河麒麟高级服务器操作系统】业务访问慢网卡丢包现象分析及处理过程

DSCP(DifferentiatedServicesCodePoint,差分服务代码点)是一种用于网络报文优先级分类的标记,使用每个数据包IP头部的TOS字段进行标识,通过不同的编码值来区分不同优先级。网卡品牌是:Mellanox,有多个优先级缓存区(8个,优先级0-7)。通过mlnx_qos工具将不同DSCP绑定到不同优先级缓存区,以设置具备不同DSCP的报文走哪个优先级缓存区。服务器业务访问很慢,可能存在网卡丢包,交换机侧有收到反压帧(有反压帧,说明服务器网卡的接收缓存区可能满了)。

2025-01-20 15:36:48 1633

原创 打造服务保障标杆典型示范案例!麒麟软件再获殊荣

近日,2024年信息技术产品服务保障案例征集结果发布。麒麟软件“某大型国有银行服务器国产操作系统批量运维案例”成功入选。

2025-01-14 10:25:51 892

原创 2024 Linux kernel补丁贡献量出炉:麒麟软件在中国企业名列前茅

2024年Linux kernel社区补丁贡献数量及排名“揭榜”。根据Linux kernel社区官方数据累计,麒麟软件补丁贡献数量入围中国企业前五。

2025-01-14 10:24:05 871

原创 【银河麒麟高级服务器操作系统】服务器异常重启故障分析及处理建议

【银河麒麟高级服务器操作系统】服务器异常重启故障分析及处理建议

2025-01-06 14:10:07 2032

原创 【银河麒麟高级服务器操作系统实例】tcp半链接数溢出分析及处理全过程

在高并发压测下出现这种问题,推测是应用程序端问题,建议应用端排查,如全连接队列长度由 net.core.somaxconn和listen(fd, backlog) 的backlog两者最小值决定,如果listen函数传参backlog太小会导致这种现象。sar -B -f sa27,查看内存回收情况,问题发生期间,没有进行内存回收,可见内存资源是够的。sar -rh -f sa27,查看内存使用情况,问题发生期间,还存在空闲内存,且可用内存较多。物理机/虚拟机/云/容器。外网/私有网络/无网络。

2025-01-03 17:21:59 1005

原创 【中标麒麟服务器操作系统实例分享】java应用DNS解析异常分析及处理

现象描述:中标麒麟服务器操作系统V7运行在 ARM虚拟机上java业务解析存储域名,出现偶发性失败。对此现象进行全流程分析,通过升级操作系统修复了所遇到的问题。

2024-12-19 14:24:36 1366

原创 【银河麒麟高级服务器操作系统】有关dd及cp测试差异的现象分析详解

现象描述:使用银河麒麟高级服务器操作系统执行两次dd用例后,表现不一致。基于上述的现象,猜测第一次dd没有等待数据完全落盘就结束了;而第二次dd是等待数据落盘之后才结束。

2024-12-13 15:18:10 1412

原创 【银河麒麟高级服务器操作系统】修改容器中journal服务日志存储位置无效—分析及解决方案

现象:systemd做init的容器中journal服务修改日志存储位置无效。经分析发现:镜像中缺少qrencode包,该包是journal日志服务所需要的。本文结合实际案例,给出来建议的解决方案。

2024-12-10 10:56:14 1337

原创 【银河麒麟操作系统真实案例分享】内存黑洞导致服务器卡死分析全过程

追踪Linux系统的内存使用一直是个难题,人们试着把能想到的各种内存消耗都加在一起,kernel text、kernel modules、buffer、cache、slab、page table、process RSS…等等,却总是与物理内存的大小对不上,这是因为Linux kernel并没有滴水不漏地统计所有的内存分配,kernel动态分配的内存中就有一部分没有计入/proc/meminfo中。

2024-12-06 16:20:38 2617

原创 【银河麒麟操作系统运维】某平台多台虚拟机异常重启分析及处理

继续分析vmcore中的堆栈信息,将其梳理如下所示。综合分析,多台机器异常重启的时间点基本一致,这降低了硬件问题的可能性,也不太可能是内核自身的问题。针对该问题我们核对了以往的问题工单,发现在另一个项目上出现过同样的问题,该项目上存在虚拟机大规模在凌晨4:30左右异常重启的问题,与本次虚拟机大规模异常重启时间一致。不同机器在同一时间同时触发异常重启,且在执行不同的内核基础函数时遇到了同一个异常的内存地址,这表明问题原因基本不在系统本身而是有第三方应用、模块等存在如堆栈溢出等异常改写了正常的内存数据。

2024-12-03 16:31:24 1781

原创 【终端加域操作】麒麟天御管控平台客户端常见问题解决方案

麒麟天御安全管控平台目前已经推出V4.1,市场推广范围越来越大,客户对于基本的终端加域操作不熟悉,本文将介绍基本的加域操作、加域过程中遇到的问题及解决方案

2024-11-27 14:44:54 1364

原创 【银河麒麟操作系统】技术分析—KASAN讲解与应用

Kernel Address SANitizer(KASAN)是一种动态内存安全错误检测工具,主要功能是检查内存越界访问和使用已释放内存(UAF)的问题。

2024-11-19 11:09:39 1046

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除