- 博客(575)
- 资源 (50)
- 问答 (1)
- 收藏
- 关注
原创 华鲲振宇 AT3500 G3 深度解析 —— 面向大模型推理的国产异构算力服务器
华鲲振宇AT3500G3是一款面向大模型推理的国产异构算力服务器,采用鲲鹏920 CPU+昇腾910B NPU架构,支持8张加速卡扩展,适用于高并发推理、AI服务化部署等场景。其优势在于国产自主生态、数据中心级可靠性及出色的推理性能,特别适合政企、金融等领域构建稳定可控的AI服务平台。该服务器主要定位于推理场景,对训练支持较弱,部署时需注意负载类型和集群规划。作为国产大模型落地的核心算力平台,AT3500G3在自主可控性和运维能力方面表现突出。
2025-12-05 00:00:00
541
原创 Ascend 910B 服务器深度解析:国产 AI 大模型训练的最强底座
Ascend910B深度解析:国产AI大模型训练的最强底座 Ascend910B是华为推出的第二代旗舰AI训练芯片,采用自研DaVinci架构和HCCS高速互联技术,算力对标NVIDIA A100,FP16/BF16算力超2000TFLOPS,支持32GB HBM内存。其软件生态成熟,兼容CANN、MindSpore及PyTorch/TensorFlow插件,已支持LLaMA、Qwen等主流大模型训练。典型配置包括Atlas800服务器(8卡)和Atlas900超算集群,适用于7B-100B参数模型训练及高
2025-12-04 09:56:43
645
原创 Ascend 服务器是什么?(Ascend Server / 昇腾服务器)
是华为基于研发的系列,用来跑:深度学习训练(Training)大模型推理(Inference)科学计算高性能计算(HPC)
2025-12-04 09:50:06
399
原创 SFT 微调是什么?
SFT(监督式微调)是大语言模型训练的关键步骤,通过对预训练模型进行人工标注数据的监督训练,使其具备指令遵循、人类风格和安全应答能力。训练过程采用标准的交叉熵损失函数,数据格式多为问答对或多轮对话。SFT位于预训练和RLHF之间,是将知识型模型转化为对话助手的基础环节,广泛应用于客服、专业领域和企业知识库等场景。与其他微调方法相比,SFT更注重基础行为训练,是模型对齐的必要步骤。
2025-12-03 15:24:40
715
原创 MindIE(Mind Inference Engine)详细技术介绍
摘要: MindIE(MindInferenceEngine)是华为昇腾AI生态中的高性能大模型推理框架,专为生产环境设计,支持LLM/VLM等模型的低延迟、高吞吐部署。其三层架构包括:前端调度层(MindIEService)负责API管理与负载均衡;推理后端(MindIEBackend)执行NPU算子计算与分布式推理;Runtime层优化昇腾硬件资源调度。关键特性涵盖动态批处理(Continuous Batching)、KV Cache分片优化、Token级流水线及多卡并行(TP/PP/MoE),显著提升
2025-12-03 13:29:10
839
原创 Python项目多模块开发如何处理 import 报错?——以 backend + sdk + nexent 项目为例,彻底解决 Unresolved reference 问题
摘要:针对Python多模块项目中的import报错问题(如backend+sdk+nexent项目),关键解决步骤包括:1)以顶层目录(nexent/)作为项目根打开;2)右键标记backend/和sdk/为SourcesRoot;3)使用uvpip install -e sdk开发模式安装SDK。同时建议用uv管理虚拟环境,并确保PyCharm使用相同解释器。最终实现IDE与命令行环境一致,消除"Unresolved reference"报错。核心原则:IDE仅识别SourcesRo
2025-11-27 01:15:00
419
原创 ramework:smolagents — 极简但强大的轻量级多智能体框架
HuggingFace推出的smolagents是一个极简但强大的轻量级多智能体框架,主打20行代码即可运行的AI智能体。相比LangChain、AutoGPT等复杂框架,smolagents更注重简单性、透明度和易调试性,特别适合快速原型开发、教学和实验性智能体。其核心设计围绕LLM+Tool+Agent三个概念,提供极简API、透明执行过程和ChatGPT风格prompt驱动。该框架支持HuggingFace模型接入,可轻松扩展工具,并能打印完整推理过程,debug十分方便。虽然不适合复杂调度场景,但作
2025-11-27 00:45:00
568
原创 Ray — 面向 AI / 多智能体的分布式计算框架全面解析
Ray是一个面向AI和多智能体的分布式计算框架,它让普通Python代码能轻松扩展为分布式系统。Ray提供两种核心编程范式:远程函数并行执行(Task)和有状态的Actor模型,支持自动调度CPU/GPU资源。相比Celery等传统任务队列,Ray无需依赖MQ,原生支持GPU计算和状态管理,特别适合构建AI训练平台、多Agent系统和分布式推理服务。通过简单的@ray.remote装饰器,开发者可以快速实现并行任务执行、强化学习环境和在线服务部署。Ray的轻量级架构和强大计算能力使其成为AI领域的理想分布式
2025-11-26 11:32:29
1000
原创 Celery — 后端异步任务与分布式任务队列的黄金标准
Celery 是 Python 领域最成熟的分布式任务队列框架,广泛用于 Web 后台异步任务、定时任务处理、批量任务调度。本文将从核心原理、架构设计、实际代码示例、生产级部署与监控体系等角度全面解析 Celery,同时探讨如何与 FastAPI、Django 等框架结合构建可靠的后台任务系统。
2025-11-26 11:21:18
420
原创 Docker 系统空间占用过大?一条命令瞬间清理 —— docker system prune
摘要:Docker系统空间占用过大通常是未清理的镜像层和容器导致的,可用docker system prune一键清理。该命令自动清除停止的容器、无用网络和缓存镜像,安全高效。对于更彻底清理可使用docker system prune -a --volumes(需确认卷使用情况)。建议设置每周定时任务维护,避免手动删除overlay2目录造成数据不一致。清理后磁盘使用率可从98%降至40%,显著释放空间。(150字)
2025-11-20 14:48:53
165
原创 pnpm + webpack + vue 项目依赖缺失错误排查与解决
摘要:在pnpm+webpack+vue项目中,遇到"These dependencies were not found"错误,原因是某些依赖未在package.json中声明。通过分析发现缺失的是Babel/VueJSX辅助包和小工具库。解决方案是显式安装这些依赖:@babel/parser、@vue/babel-helper-vue-jsx-merge-props等。与npm/yarn不同,pnpm不会自动暴露"传递依赖
2025-10-24 11:32:28
601
原创 Claude Code:让终端里的 AI 编程助手陪你写代码
ClaudeCode是一款集成在终端、IDE和GitHub的AI编程助手,能够通过自然语言交互帮助开发者高效完成编码任务。它具备代码生成、解释、优化功能,可自动化Git工作流,支持跨平台使用。主要特点包括:理解代码上下文、自然语言交互、自动化常规任务、提供代码解释和建议。开发者只需简单命令即可获得代码生成、文档撰写、问题修复等服务,显著提升开发效率。无论是初学者还是资深工程师,都能通过ClaudeCode简化开发流程,专注核心逻辑设计。
2025-10-24 10:14:24
976
原创 第十六课(零基础友好版)|期末综合项目发布会与互评(五年级·自学 + 班级活动)
本文介绍了五年级编程课程的期末综合项目发布会与互评活动方案。活动时长90-120分钟,学生需完成并展示一个编程项目(如手势贴纸相机、语音跑酷游戏等),内容包括选题、发布会流程、展示脚本、展板制作、互评规则等。活动强调学生表达能力培养,要求1分钟讲清项目功能、实现方法和改进点,并通过互评表进行评分。设置最佳创意奖、技术奖和表达奖,颁发证书和徽章。最后学生需填写项目反思卡,总结收获与改进方向。整个流程注重培养学生的编程能力、表达能力和数字素养。
2025-10-08 00:45:00
338
原创 第十五课(零基础友好版)|用 Python 调用现成 AI 能力(图像/语音 API 概念,超详细)
本文是一份零基础友好的Python教程,教读者如何调用现成的AI能力实现图像识别和语音转文字功能。课程分为预备知识、开发环境配置、两个实践项目(图像识别和语音转文字)、API安全常识、JSON解析技巧等内容。教程采用"请求-响应"的餐厅点菜类比解释API概念,提供了真实模式(联网)和模拟模式(离线)两种实现方式,并强调APIKey的安全使用。通过90-110分钟的学习,读者将掌握调用AI服务的基本流程,完成两个实践项目,并获得"API小工程师"认证。
2025-10-08 00:30:00
54
原创 第十三课(零基础友好版)|传感器 + AI:用 micro:bit/摄像头做输入(五年级·自学)
本课面向五年级学生,通过传感器与AI结合实现互动项目。课程分为设备连接、传感器测试、AI模型加载和项目实践四部分。重点学习使用micro:bit传感器(加速度、按钮)和摄像头AI识别(手势),完成两个项目:倾斜控制小车(支持手势暂停)和相机滤镜切换器。课程提供详细步骤、调参建议和常见问题排查,无硬件也可用键盘模拟操作。完成项目并通过测试可获得"传感器·AI互动小达人"徽章,为后续Python学习打下基础。建议学习时长100-120分钟,需准备mBlock软件、micro:bit和摄像头。
2025-10-07 00:15:00
62
原创 第十四课(零基础友好版)|轻松上手 Python:用 turtle 画图理解语法(五年级·自学)
本课为零基础五年级学生设计,通过Python的turtle模块学习编程基础。课程时长90-110分钟,包含12个循序渐进的学习环节:从安装环境、画直线开始,逐步学习循环画正方形、变量绘制正多边形,到嵌套循环绘制彩色花朵、函数封装和条件判断制作星星图案。课程特点包括:可视化学习编程概念(顺序/循环/条件/变量/函数)、常见错误排查指南、课后延伸挑战和完成徽章激励。通过趣味绘图实践,学生将掌握Python基础语法和调试能力,为后续编程学习打下基础。
2025-10-07 00:15:00
148
原创 第十二课(零基础友好版)|公平与偏见:AI 也会“犯错”吗?(五年级·自学)
《AI公平性探索:五年级零基础自学课程》摘要 本课程面向五年级学生设计,通过80-100分钟的互动学习,帮助理解AI公平性与偏见问题。课程包含两个核心实验:一是通过"不均衡数据集"观察识别错误(如20个👍对比80个✋),发现样本少的类别准确率更低;二是测试不同场景(明亮/杂乱/昏暗)下的识别差异。学生将学习制作"混淆表"分析错误类型,并提出改进计划(如补充数据、丰富场景)。课程强调安全准则(不采集敏感信息)和项目实践(制作模型"体检报告"),最终
2025-10-06 00:30:00
43
原创 第十一课(零基础友好版)|语音指令小项目:语音控制小游戏(五年级·自学)
本课指导五年级学生用Scratch/mBlock制作语音控制跑酷游戏。主要内容包括:1)通过Teachable Machine音频模型实现jump/stop语音指令识别;2)构建游戏核心功能(角色跳跃、障碍物生成、计分系统);3)加入去抖动机制和阈值调节减少误触发;4)提供手动按键的备用方案。课程采用模块化设计,包含12个步骤(约100-120分钟),涵盖从初始化、角色控制到游戏逻辑的完整开发流程,并附自检清单和常见问题解决方案。完成项目可获得"语音游戏小达人"徽章,为后续AI伦理课程铺
2025-10-06 00:15:00
37
原创 第九课(零基础友好版)|图像识别小项目:手势控制相机贴纸(五年级·自学)
本课为零基础学生设计了一个手势控制相机贴纸项目,通过mBlock接入Teachable Machine训练的手势模型(👍/✋/👎),实现不同手势触发墨镜、星星、气泡三种贴纸效果。课程包含模型连接、贴纸布局、置信度阈值设置、去抖动优化等关键步骤,并提供两条实现路线(推荐mBlock扩展/备用按键模拟方案)。学生需完成贴纸显示逻辑、一键重置功能,并通过调整阈值优化识别稳定性(建议初始值0.8)。课程配备自检清单、常见问题解答及进阶挑战(如贴纸跟手移动),最终目标为制作出可交互的手势相机应用,为后续语音识别课
2025-10-05 00:15:00
137
原创 第十课(零基础友好版)|语音识别入门:训练“听口令”模型(五年级·自学)
本文介绍了一个面向五年级学生的语音识别入门课程,通过Teachable Machine平台训练"听口令"模型。课程包含数据采集(录制口令和背景噪声)、模型训练、测试改进等完整流程,并可选接入mBlock实现语音控制角色跳跃。重点讲解了如何采集多样化样本(8-12段/类)、加入近似词干扰提升模型鲁棒性,以及设置识别阈值和去抖动等实用技巧。完成课程后,学生将能够建立一个可区分"开始/停止"等简单口令的语音模型,并理解背景噪声和干扰样本的作用。课程采用90-110分钟的自学
2025-10-05 00:15:00
383
原创 第八课(零基础友好版)|第一次训练模型(Teachable Machine,超详细)
本教程为零基础学习者提供使用Teachable Machine训练图像分类模型的详细指南。课程时长80-100分钟,仅需浏览器和摄像头即可完成。主要内容包括:项目创建、数据采集(建议每类50-80张包含不同角度/光线/背景的样本)、模型训练与测试、改进方法(针对易错样本补充数据)以及模型保存(在线链接或离线包)。特别强调隐私安全注意事项,建议只拍摄手势/物体,避免录入人脸或个人隐私信息。完成课程后,学习者将掌握完整模型训练流程,获得可用于后续项目的模型链接,为"手势贴纸相机"等应用开发奠
2025-10-04 17:42:45
305
原创 第七课(零基础友好版)|机器学习像养宠物:数据—训练—测试(五年级·自学)
这篇文章是为零基础学习者设计的机器学习入门课程,采用"养宠物"的比喻来讲解机器学习的基本流程。课程包含两个实践项目:手势分类器(识别👍/✋/👎)和音频口令识别器(识别"开始/停止"),每个步骤都详细说明了操作方法和注意事项。教学强调数据采集的多样性、模型测试和改进的重要性,并特别提醒隐私和安全问题。课程最后提供自测题和徽章奖励,为后续Scratch项目应用打下基础。整个课程设计生动有趣,适合五年级学生自学,约90-110分钟完成。
2025-10-04 15:52:48
389
原创 第六课(零基础友好版)|数据与特征:让电脑“看见”信息(五年级·自学)
【摘要】本课为零基础五年级学生设计,通过"数据-特征-标签"概念教学和Scratch实践项目,帮助理解计算机信息处理原理。课程包含两个实践环节:纸上卡片分类练习(按颜色/形状等特征分组)和Scratch"水果分拣机"制作(通过颜色特征实现自动分类)。重点培养学生理解数据多样性对计算机识别的重要性,完成目标可获得"特征小侦探"徽章,为后续AI学习奠定基础。建议学习时长80-100分钟,无需注册可离线完成。
2025-10-01 00:15:00
46
原创 第五课(零基础友好版)|小游戏项目:躲避方块(巩固逻辑)
【150字摘要】 本课为零基础学员设计《躲避方块》小游戏开发教程,总时长80-100分钟。核心内容包括:键盘控制角色移动、方块随机下落与碰撞检测、变量计分与广播切换场景。分步教学涵盖基础版(单方块下落)和进阶版(克隆实现多方块),重点讲解玩家移动逻辑、游戏结束判定及重新开始功能。通过自检清单和6分钟小测巩固知识点,完成可获得"逻辑闯关者Lv.5"徽章。课程特别强调常见问题排查(如分数异常、克隆卡顿),并提供道具系统、关卡切换等扩展思路,为后续AI课程铺垫基础编程逻辑。
2025-09-30 02:00:00
50
原创 第四课(零基础友好版)|程序思维:顺序、循环与条件(五年级·自学)
本课为零基础五年级学生设计,通过Scratch编程学习三大程序思维:顺序、循环与条件。课程包含三个实践练习:顺序动画(小猫问候、行走、转身)、循环跑圈(小猫持续绕圈)、条件小游戏(30秒躲避幽灵)。学生将掌握基础编程操作(开始/停止/保存),理解三种程序结构的区别与应用,完成约75-90分钟的自学内容。课程配有详细步骤指导、改一改优化环节、小测和常见问题排查,最后通过制作完整小游戏巩固知识点,获得"程序思维达人Lv.4"徽章。
2025-09-29 21:40:44
69
原创 第三课|图形化编程入门(Scratch/mBlock,自学版,五年级)
本课为五年级学生提供Scratch/mBlock图形化编程入门教学,包含两个项目实践和核心概念学习。课程首先介绍界面操作和基础积木功能,重点完成《键盘指挥家》和《接水果》两个项目,涉及移动控制、音效、变量、循环等编程概念。通过90分钟的学习,学生将掌握事件、运动、侦测等积木的使用,能独立完成带计分和倒计时的小游戏。课程包含详细步骤指引、自检清单和常见问题解答,最后通过小测检验学习成果,完成可获得"图形化小能手"徽章。教学注重实践,为后续AI互动游戏开发奠定基础。
2025-09-29 21:37:19
253
原创 第二课(零基础友好版)|计算机与网络安全小常识 + 超详细 Scratch 实践步骤(五年级)
《计算机与网络安全小常识》是为五年级学生设计的自学课程,通过Scratch编程实践学习网络安全知识。课程包含认识个人信息、创建强密码、制作两个Scratch项目(安全信息分类游戏和两步验证模拟器)等内容,时长70-90分钟。学生将学习5条网络安全规则,掌握口令句设计方法,完成项目后需签署家庭上网公约并参与小测试。课程提供故障排查指南和进阶挑战,完成者可获得"网络安全守护者"徽章。该课程将安全知识与编程实践结合,适合家庭或学校使用。
2025-09-28 21:23:20
73
原创 第一课|认识 AI + Scratch 初体验(自学版,五年级)
《AI与Scratch编程初体验》是为五年级学生设计的60-75分钟编程启蒙课程。课程通过三个目标展开:认识AI应用(如人脸解锁、语音助手)、学习Scratch基础操作(制作会打招呼和移动的小猫程序)、了解网络安全(不泄露个人信息)。课程包含两个实践项目:基础版"打招呼小猫"和进阶版"碰撞检测游戏",通过积木编程培养逻辑思维。配套提供离线版软件下载和安全提示,最后通过选择题和实操测试巩固学习成果,为后续AI识别功能学习打下基础。
2025-09-28 21:01:37
98
原创 专为五年级小朋友设计的《AI 编程入门》基础教程目录(16 课时,建议每课 60–90 分钟)。每节都给出目标、关键词、工具与产出,便于直接用来备课或自学
《AI与编程启蒙课程摘要》 本课程通过16个模块循序渐进地引导学生探索人工智能与编程:从认识AI基础概念(分类、预测)到Scratch图形化编程(顺序/循环结构),再到机器学习实践(Teachable Machine训练图像/语音模型)。课程融合理论与实践,包含躲避游戏设计、手势控制相机、语音指令游戏等趣味项目,同时探讨数据偏见、隐私安全等伦理问题。最终通过Python基础体验和综合项目开发,培养学生计算思维与AI应用能力,强调"数据-训练-测试"的机器学习逻辑,完成从认知到创造的完整学
2025-09-28 20:54:09
118
原创 在 openEuler 上排查 Docker 同桥网络不通:从“全线超时”到定位容器没启动
摘要: 在openEuler 24.03上部署Docker容器集群时,出现同桥网络不通问题。通过排查发现,核心原因是openEuler特有的桥与防火墙联动机制(bridge-nf-call-*)阻断了容器间通信。修复步骤包括:关闭桥层过滤(sysctl调整)、放开防火墙规则(firewalld/iptables)、禁用反向路径过滤(rp_filter)。网络恢复后,进一步发现OpenWebUI容器因未启动导致8080端口不可用。最终总结为:先解决系统层网络拦截(openEuler桥防火墙联动),再检查应用层
2025-09-26 11:44:52
902
原创 记一次「Failed to initialize NVML」故障排查:从版本不一致到系统干净收尾
摘要: 本文记录了Ubuntu 22.04系统下因NVIDIA驱动版本不一致(内核模块570.133.20与用户态库570.172.08)导致nvidia-smi报错Failed to initialize NVML的排查过程。修复方案选择升级内核模块至570.172.08以匹配用户态版本,通过apt install指定版本并重建引导。过程中因apt autoremove触发MySQL未初始化问题,需清理或初始化MySQL以恢复apt流程。最终通过版本对齐和系统重启解决问题,并总结了版本检查命令和驱动升级的
2025-09-24 18:05:34
1119
原创 断电后 yum/dnf 报 “BDB0113 / BDB1507 / DB_RUNRECOVERY”:一次彻底修复手记
摘要: 本文详细记录了断电导致yum/dnf报"BDB0113/BDB1507/DB_RUNRECOVERY"错误的修复过程。核心原因为RPM数据库(rpmdb)因异常断电损坏,涉及BerkeleyDB锁文件残留或索引问题。修复分三步:终止占用进程→清理锁文件→重建数据库索引(rpm --rebuilddb),必要时重建主库(保留已安装软件)。提供一键修复脚本及预防建议(如UPS保护、定期备份)。修复后需优先恢复rpmdb,再处理业务软件(如Docker)安装。适用于CentOS/RHE
2025-08-26 14:40:16
552
原创 解决 VSCode 运行 Python 时 ModuleNotFoundError: No module named ‘open_webui‘ 问题
在VSCode调试Python项目时,模块导入错误通常是由于Python搜索路径未包含项目目录。解决方法是在.vscode/launch.json配置文件中设置工作目录和环境变量,具体步骤包括:创建配置文件、添加调试配置(指定程序路径、工作目录和PYTHONPATH)、保存并测试运行。这种方法能有效解决ModuleNotFoundError问题,且不影响全局环境或项目源码,适用于多入口文件的项目调试。
2025-08-14 11:37:10
743
原创 在 openEuler 24.03 (LTS) 上安装 FFmpeg 的完整指南
openEuler24.03(LTS)安装FFmpeg指南:通过sudo dnf install ffmpeg ffmpeg-devel -y命令即可快速安装FFmpeg及其开发工具包。安装后可通过ffmpeg -version验证,该工具支持视频转码、音频提取等多媒体处理。ffmpeg-devel包含开发所需的头文件和库,适合二次开发。openEuler官方源已内置FFmpeg,无需额外配置,方便开发者直接使用。
2025-08-07 16:38:08
709
原创 解决 GitLab external_url 修改无效的问题:保留数据重新生成配置
摘要:解决GitLab修改external_url无效问题时,通过删除config目录保留数据重新生成配置是最佳方案。操作步骤为:停止容器→删除./config/*→重启容器,GitLab会自动根据docker-compose.yml生成新配置。该方法适用于IP/域名变更后保留原有数据的场景,简单高效,但操作前建议备份。验证时查看gitlab.rb文件中的external_url是否更新,并确认Web界面Clone地址已变更。此方案避免了手动修改配置的复杂性,适合中小规模GitLab环境快速解决问题。
2025-08-04 11:08:44
782
原创 使用 Docker 部署 Label Studio 时本地文件无法显示的排查与解决
Docker部署LabelStudio时遇到本地图片404错误的排查与解决。问题源于环境变量LABEL_STUDIO_LOCAL_FILES_DOCUMENT_ROOT配置为/obs,而同步存储路径为/obs/...,导致拼接错误。提供两种解决方案:1)保持环境变量不变,修改SyncStorage为相对路径;2)将环境变量改为/,保持原始路径。最终采用方案二成功解决,图片正常显示。建议生产环境明确配置文档根路径,确保路径一致性。排查时重点检查容器内文件存在性和环境变量与路径的匹配情况。
2025-08-01 16:00:05
1447
原创 GitLab Docker Compose 迁移后 Redis 权限问题排查与解决
GitLab迁移后Redis权限问题排查与解决摘要:在Docker Compose迁移GitLab时,Redis因权限问题无法启动。原因是容器内UID/GID(997)与宿主机不一致,导致Redis无法访问数据文件。临时解决方案是开放权限(chmod -R 777),长期方案需对齐UID/GID或重建Redis数据。建议迁移前确认权限映射,或使用备份恢复方式避免此类问题。
2025-08-01 14:27:33
935
原创 KubeSphere 集群监控 502 报错排查实录:基于 WhizardTelemetry 的 Prometheus 端点故障与重装方案
摘要:KubeSphere平台中WhizardTelemetry监控组件出现502错误,导致监控数据无法获取。排查发现PrometheusEndpoints为空、Operator权限不足及CR命名空间错位等问题。解决方案包括卸载现有组件、清理残留资源并重装。经验表明命名空间一致性、权限检查及重装是高效恢复监控的关键。通过编写一键排查脚本可快速定位问题,确保监控系统稳定运行。
2025-07-29 11:21:56
987
原创 从 TLS 握手失败到证书统一:一次 KubeSphere Webhook 故障的排查与修复
《KubeSphere Webhook TLS证书故障排查与修复》摘要:部署KubeSphere时出现Webhook TLS握手失败,导致功能异常。故障源于手工替换证书导致CA信任链不一致。解决方案包括:1)安装cert-manager统一管理证书;2)升级KubeSphere启用cert-manager支持;3)清理手工证书配置;4)使用openssl验证服务端证书。经验表明应避免手工证书管理,推荐使用cert-manager统一管理内部证书,并通过调试Pod快速验证证书链一致性。此次排查解决了Webho
2025-07-29 09:52:50
642
原创 手动清理 Kubernetes Completed 状态 Pod 实战指南
Kubernetes Completed状态Pod清理指南 本文介绍如何手动清理Kubernetes集群中已完成的Pod(状态为Completed)。这些Pod通常由Job或CronJob产生,会占用存储资源并影响监控效率。文章提供了多种清理方法:1)直接删除所有Completed状态Pod;2)按前缀筛选特定Pod(如devops-开头的);3)同时清理关联的Job资源。最后建议通过配置ttlSecondsAfterFinished参数实现自动清理,以保持集群整洁并提高运维效率。
2025-07-26 00:30:00
981
ajaxguide Ajax 实用技巧完全指南
2011-03-24
fds.swc airfds.swc fds_rb.swc playerfds.swc
2010-06-12
birt 项目 配置
2010-01-22
HTML+JS自动抽奖系统 适合每人手上有一个号连续的号
2011-12-08
weibo-phpsdk-v2-2013-02-20.zip
2013-05-07
jmxtools jmxri-1.2.1.jar
2014-03-19
jmx-1_2_1-bin,jmxremote-1_0_1-bin,com.sun.jdmk.comm.HtmlAdaptorServer
2013-04-24
jmxremote_optional.jara
2014-11-14
blazeds.war
2010-06-12
mysql-connector-java-5.1.6
2010-04-13
javamail-1.4.3.zip
2010-02-05
flex4.5.1.chm flex4API文档
2012-02-22
屏幕录像专家
2013-04-18
openEuler 24.03 全流程实战:用 Ansible 5 分钟部署分布式 MinIO 高可用集群
2025-07-04
jeopardy-tiny.json
2025-03-13
办公软件-开源软件-LibreOffice-25.2.0-Win-x86-64-安装包.msi
2025-02-19
离线镜像 registry.k8s.io/nfd/node-feature-discovery:v0.16.6
2024-12-18
离线安装 KubeSphere实操记录
2024-12-03
libstdc++.so.6.0.29
2024-09-13
kafka-schema-registry-client-6.2.2.jar
2023-04-25
helm-v3.10.1-linux-amd64.tar.gz
2022-11-01
Star NX-500 针式打印机驱动
2019-10-09
lrzsz-0.12.20-6-x86_64.pkg.tar.xz
2019-12-17
MemoryAnalyzer-1.9.1.20190826-win32.win32.x86_64.zip
2019-10-03
sysstat-12.3.1.tar.gz
2020-04-07
我遇到一个奇怪的问题,php代码里面凡是含有//这样的注释,include 失败
2015-07-20
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅