自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(575)
  • 资源 (50)
  • 问答 (1)
  • 收藏
  • 关注

原创 华鲲振宇 AT3500 G3 深度解析 —— 面向大模型推理的国产异构算力服务器

华鲲振宇AT3500G3是一款面向大模型推理的国产异构算力服务器,采用鲲鹏920 CPU+昇腾910B NPU架构,支持8张加速卡扩展,适用于高并发推理、AI服务化部署等场景。其优势在于国产自主生态、数据中心级可靠性及出色的推理性能,特别适合政企、金融等领域构建稳定可控的AI服务平台。该服务器主要定位于推理场景,对训练支持较弱,部署时需注意负载类型和集群规划。作为国产大模型落地的核心算力平台,AT3500G3在自主可控性和运维能力方面表现突出。

2025-12-05 00:00:00 541

原创 Ascend 910B 服务器深度解析:国产 AI 大模型训练的最强底座

Ascend910B深度解析:国产AI大模型训练的最强底座 Ascend910B是华为推出的第二代旗舰AI训练芯片,采用自研DaVinci架构和HCCS高速互联技术,算力对标NVIDIA A100,FP16/BF16算力超2000TFLOPS,支持32GB HBM内存。其软件生态成熟,兼容CANN、MindSpore及PyTorch/TensorFlow插件,已支持LLaMA、Qwen等主流大模型训练。典型配置包括Atlas800服务器(8卡)和Atlas900超算集群,适用于7B-100B参数模型训练及高

2025-12-04 09:56:43 645

原创 Ascend 服务器是什么?(Ascend Server / 昇腾服务器)

是华为基于研发的系列,用来跑:深度学习训练(Training)大模型推理(Inference)科学计算高性能计算(HPC)

2025-12-04 09:50:06 399

原创 SFT 微调是什么?

SFT(监督式微调)是大语言模型训练的关键步骤,通过对预训练模型进行人工标注数据的监督训练,使其具备指令遵循、人类风格和安全应答能力。训练过程采用标准的交叉熵损失函数,数据格式多为问答对或多轮对话。SFT位于预训练和RLHF之间,是将知识型模型转化为对话助手的基础环节,广泛应用于客服、专业领域和企业知识库等场景。与其他微调方法相比,SFT更注重基础行为训练,是模型对齐的必要步骤。

2025-12-03 15:24:40 715

原创 MindIE(Mind Inference Engine)详细技术介绍

摘要: MindIE(MindInferenceEngine)是华为昇腾AI生态中的高性能大模型推理框架,专为生产环境设计,支持LLM/VLM等模型的低延迟、高吞吐部署。其三层架构包括:前端调度层(MindIEService)负责API管理与负载均衡;推理后端(MindIEBackend)执行NPU算子计算与分布式推理;Runtime层优化昇腾硬件资源调度。关键特性涵盖动态批处理(Continuous Batching)、KV Cache分片优化、Token级流水线及多卡并行(TP/PP/MoE),显著提升

2025-12-03 13:29:10 839

原创 Python项目多模块开发如何处理 import 报错?——以 backend + sdk + nexent 项目为例,彻底解决 Unresolved reference 问题

摘要:针对Python多模块项目中的import报错问题(如backend+sdk+nexent项目),关键解决步骤包括:1)以顶层目录(nexent/)作为项目根打开;2)右键标记backend/和sdk/为SourcesRoot;3)使用uvpip install -e sdk开发模式安装SDK。同时建议用uv管理虚拟环境,并确保PyCharm使用相同解释器。最终实现IDE与命令行环境一致,消除"Unresolved reference"报错。核心原则:IDE仅识别SourcesRo

2025-11-27 01:15:00 419

原创 ramework:smolagents — 极简但强大的轻量级多智能体框架

HuggingFace推出的smolagents是一个极简但强大的轻量级多智能体框架,主打20行代码即可运行的AI智能体。相比LangChain、AutoGPT等复杂框架,smolagents更注重简单性、透明度和易调试性,特别适合快速原型开发、教学和实验性智能体。其核心设计围绕LLM+Tool+Agent三个概念,提供极简API、透明执行过程和ChatGPT风格prompt驱动。该框架支持HuggingFace模型接入,可轻松扩展工具,并能打印完整推理过程,debug十分方便。虽然不适合复杂调度场景,但作

2025-11-27 00:45:00 568

原创 Ray — 面向 AI / 多智能体的分布式计算框架全面解析

Ray是一个面向AI和多智能体的分布式计算框架,它让普通Python代码能轻松扩展为分布式系统。Ray提供两种核心编程范式:远程函数并行执行(Task)和有状态的Actor模型,支持自动调度CPU/GPU资源。相比Celery等传统任务队列,Ray无需依赖MQ,原生支持GPU计算和状态管理,特别适合构建AI训练平台、多Agent系统和分布式推理服务。通过简单的@ray.remote装饰器,开发者可以快速实现并行任务执行、强化学习环境和在线服务部署。Ray的轻量级架构和强大计算能力使其成为AI领域的理想分布式

2025-11-26 11:32:29 1000

原创 Celery — 后端异步任务与分布式任务队列的黄金标准

Celery 是 Python 领域最成熟的分布式任务队列框架,广泛用于 Web 后台异步任务、定时任务处理、批量任务调度。本文将从核心原理、架构设计、实际代码示例、生产级部署与监控体系等角度全面解析 Celery,同时探讨如何与 FastAPI、Django 等框架结合构建可靠的后台任务系统。

2025-11-26 11:21:18 420

原创 Docker 系统空间占用过大?一条命令瞬间清理 —— docker system prune

摘要:Docker系统空间占用过大通常是未清理的镜像层和容器导致的,可用docker system prune一键清理。该命令自动清除停止的容器、无用网络和缓存镜像,安全高效。对于更彻底清理可使用docker system prune -a --volumes(需确认卷使用情况)。建议设置每周定时任务维护,避免手动删除overlay2目录造成数据不一致。清理后磁盘使用率可从98%降至40%,显著释放空间。(150字)

2025-11-20 14:48:53 165

原创 pnpm + webpack + vue 项目依赖缺失错误排查与解决

摘要:在pnpm+webpack+vue项目中,遇到"These dependencies were not found"错误,原因是某些依赖未在package.json中声明。通过分析发现缺失的是Babel/VueJSX辅助包和小工具库。解决方案是显式安装这些依赖:@babel/parser、@vue/babel-helper-vue-jsx-merge-props等。与npm/yarn不同,pnpm不会自动暴露"传递依赖

2025-10-24 11:32:28 601

原创 Claude Code:让终端里的 AI 编程助手陪你写代码

ClaudeCode是一款集成在终端、IDE和GitHub的AI编程助手,能够通过自然语言交互帮助开发者高效完成编码任务。它具备代码生成、解释、优化功能,可自动化Git工作流,支持跨平台使用。主要特点包括:理解代码上下文、自然语言交互、自动化常规任务、提供代码解释和建议。开发者只需简单命令即可获得代码生成、文档撰写、问题修复等服务,显著提升开发效率。无论是初学者还是资深工程师,都能通过ClaudeCode简化开发流程,专注核心逻辑设计。

2025-10-24 10:14:24 976

原创 第十六课(零基础友好版)|期末综合项目发布会与互评(五年级·自学 + 班级活动)

本文介绍了五年级编程课程的期末综合项目发布会与互评活动方案。活动时长90-120分钟,学生需完成并展示一个编程项目(如手势贴纸相机、语音跑酷游戏等),内容包括选题、发布会流程、展示脚本、展板制作、互评规则等。活动强调学生表达能力培养,要求1分钟讲清项目功能、实现方法和改进点,并通过互评表进行评分。设置最佳创意奖、技术奖和表达奖,颁发证书和徽章。最后学生需填写项目反思卡,总结收获与改进方向。整个流程注重培养学生的编程能力、表达能力和数字素养。

2025-10-08 00:45:00 338

原创 第十五课(零基础友好版)|用 Python 调用现成 AI 能力(图像/语音 API 概念,超详细)

本文是一份零基础友好的Python教程,教读者如何调用现成的AI能力实现图像识别和语音转文字功能。课程分为预备知识、开发环境配置、两个实践项目(图像识别和语音转文字)、API安全常识、JSON解析技巧等内容。教程采用"请求-响应"的餐厅点菜类比解释API概念,提供了真实模式(联网)和模拟模式(离线)两种实现方式,并强调APIKey的安全使用。通过90-110分钟的学习,读者将掌握调用AI服务的基本流程,完成两个实践项目,并获得"API小工程师"认证。

2025-10-08 00:30:00 54

原创 第十三课(零基础友好版)|传感器 + AI:用 micro:bit/摄像头做输入(五年级·自学)

本课面向五年级学生,通过传感器与AI结合实现互动项目。课程分为设备连接、传感器测试、AI模型加载和项目实践四部分。重点学习使用micro:bit传感器(加速度、按钮)和摄像头AI识别(手势),完成两个项目:倾斜控制小车(支持手势暂停)和相机滤镜切换器。课程提供详细步骤、调参建议和常见问题排查,无硬件也可用键盘模拟操作。完成项目并通过测试可获得"传感器·AI互动小达人"徽章,为后续Python学习打下基础。建议学习时长100-120分钟,需准备mBlock软件、micro:bit和摄像头。

2025-10-07 00:15:00 62

原创 第十四课(零基础友好版)|轻松上手 Python:用 turtle 画图理解语法(五年级·自学)

本课为零基础五年级学生设计,通过Python的turtle模块学习编程基础。课程时长90-110分钟,包含12个循序渐进的学习环节:从安装环境、画直线开始,逐步学习循环画正方形、变量绘制正多边形,到嵌套循环绘制彩色花朵、函数封装和条件判断制作星星图案。课程特点包括:可视化学习编程概念(顺序/循环/条件/变量/函数)、常见错误排查指南、课后延伸挑战和完成徽章激励。通过趣味绘图实践,学生将掌握Python基础语法和调试能力,为后续编程学习打下基础。

2025-10-07 00:15:00 148

原创 第十二课(零基础友好版)|公平与偏见:AI 也会“犯错”吗?(五年级·自学)

《AI公平性探索:五年级零基础自学课程》摘要 本课程面向五年级学生设计,通过80-100分钟的互动学习,帮助理解AI公平性与偏见问题。课程包含两个核心实验:一是通过"不均衡数据集"观察识别错误(如20个👍对比80个✋),发现样本少的类别准确率更低;二是测试不同场景(明亮/杂乱/昏暗)下的识别差异。学生将学习制作"混淆表"分析错误类型,并提出改进计划(如补充数据、丰富场景)。课程强调安全准则(不采集敏感信息)和项目实践(制作模型"体检报告"),最终

2025-10-06 00:30:00 43

原创 第十一课(零基础友好版)|语音指令小项目:语音控制小游戏(五年级·自学)

本课指导五年级学生用Scratch/mBlock制作语音控制跑酷游戏。主要内容包括:1)通过Teachable Machine音频模型实现jump/stop语音指令识别;2)构建游戏核心功能(角色跳跃、障碍物生成、计分系统);3)加入去抖动机制和阈值调节减少误触发;4)提供手动按键的备用方案。课程采用模块化设计,包含12个步骤(约100-120分钟),涵盖从初始化、角色控制到游戏逻辑的完整开发流程,并附自检清单和常见问题解决方案。完成项目可获得"语音游戏小达人"徽章,为后续AI伦理课程铺

2025-10-06 00:15:00 37

原创 第九课(零基础友好版)|图像识别小项目:手势控制相机贴纸(五年级·自学)

本课为零基础学生设计了一个手势控制相机贴纸项目,通过mBlock接入Teachable Machine训练的手势模型(👍/✋/👎),实现不同手势触发墨镜、星星、气泡三种贴纸效果。课程包含模型连接、贴纸布局、置信度阈值设置、去抖动优化等关键步骤,并提供两条实现路线(推荐mBlock扩展/备用按键模拟方案)。学生需完成贴纸显示逻辑、一键重置功能,并通过调整阈值优化识别稳定性(建议初始值0.8)。课程配备自检清单、常见问题解答及进阶挑战(如贴纸跟手移动),最终目标为制作出可交互的手势相机应用,为后续语音识别课

2025-10-05 00:15:00 137

原创 第十课(零基础友好版)|语音识别入门:训练“听口令”模型(五年级·自学)

本文介绍了一个面向五年级学生的语音识别入门课程,通过Teachable Machine平台训练"听口令"模型。课程包含数据采集(录制口令和背景噪声)、模型训练、测试改进等完整流程,并可选接入mBlock实现语音控制角色跳跃。重点讲解了如何采集多样化样本(8-12段/类)、加入近似词干扰提升模型鲁棒性,以及设置识别阈值和去抖动等实用技巧。完成课程后,学生将能够建立一个可区分"开始/停止"等简单口令的语音模型,并理解背景噪声和干扰样本的作用。课程采用90-110分钟的自学

2025-10-05 00:15:00 383

原创 第八课(零基础友好版)|第一次训练模型(Teachable Machine,超详细)

本教程为零基础学习者提供使用Teachable Machine训练图像分类模型的详细指南。课程时长80-100分钟,仅需浏览器和摄像头即可完成。主要内容包括:项目创建、数据采集(建议每类50-80张包含不同角度/光线/背景的样本)、模型训练与测试、改进方法(针对易错样本补充数据)以及模型保存(在线链接或离线包)。特别强调隐私安全注意事项,建议只拍摄手势/物体,避免录入人脸或个人隐私信息。完成课程后,学习者将掌握完整模型训练流程,获得可用于后续项目的模型链接,为"手势贴纸相机"等应用开发奠

2025-10-04 17:42:45 305

原创 第七课(零基础友好版)|机器学习像养宠物:数据—训练—测试(五年级·自学)

这篇文章是为零基础学习者设计的机器学习入门课程,采用"养宠物"的比喻来讲解机器学习的基本流程。课程包含两个实践项目:手势分类器(识别👍/✋/👎)和音频口令识别器(识别"开始/停止"),每个步骤都详细说明了操作方法和注意事项。教学强调数据采集的多样性、模型测试和改进的重要性,并特别提醒隐私和安全问题。课程最后提供自测题和徽章奖励,为后续Scratch项目应用打下基础。整个课程设计生动有趣,适合五年级学生自学,约90-110分钟完成。

2025-10-04 15:52:48 389

原创 第六课(零基础友好版)|数据与特征:让电脑“看见”信息(五年级·自学)

【摘要】本课为零基础五年级学生设计,通过"数据-特征-标签"概念教学和Scratch实践项目,帮助理解计算机信息处理原理。课程包含两个实践环节:纸上卡片分类练习(按颜色/形状等特征分组)和Scratch"水果分拣机"制作(通过颜色特征实现自动分类)。重点培养学生理解数据多样性对计算机识别的重要性,完成目标可获得"特征小侦探"徽章,为后续AI学习奠定基础。建议学习时长80-100分钟,无需注册可离线完成。

2025-10-01 00:15:00 46

原创 第五课(零基础友好版)|小游戏项目:躲避方块(巩固逻辑)

【150字摘要】 本课为零基础学员设计《躲避方块》小游戏开发教程,总时长80-100分钟。核心内容包括:键盘控制角色移动、方块随机下落与碰撞检测、变量计分与广播切换场景。分步教学涵盖基础版(单方块下落)和进阶版(克隆实现多方块),重点讲解玩家移动逻辑、游戏结束判定及重新开始功能。通过自检清单和6分钟小测巩固知识点,完成可获得"逻辑闯关者Lv.5"徽章。课程特别强调常见问题排查(如分数异常、克隆卡顿),并提供道具系统、关卡切换等扩展思路,为后续AI课程铺垫基础编程逻辑。

2025-09-30 02:00:00 50

原创 第四课(零基础友好版)|程序思维:顺序、循环与条件(五年级·自学)

本课为零基础五年级学生设计,通过Scratch编程学习三大程序思维:顺序、循环与条件。课程包含三个实践练习:顺序动画(小猫问候、行走、转身)、循环跑圈(小猫持续绕圈)、条件小游戏(30秒躲避幽灵)。学生将掌握基础编程操作(开始/停止/保存),理解三种程序结构的区别与应用,完成约75-90分钟的自学内容。课程配有详细步骤指导、改一改优化环节、小测和常见问题排查,最后通过制作完整小游戏巩固知识点,获得"程序思维达人Lv.4"徽章。

2025-09-29 21:40:44 69

原创 第三课|图形化编程入门(Scratch/mBlock,自学版,五年级)

本课为五年级学生提供Scratch/mBlock图形化编程入门教学,包含两个项目实践和核心概念学习。课程首先介绍界面操作和基础积木功能,重点完成《键盘指挥家》和《接水果》两个项目,涉及移动控制、音效、变量、循环等编程概念。通过90分钟的学习,学生将掌握事件、运动、侦测等积木的使用,能独立完成带计分和倒计时的小游戏。课程包含详细步骤指引、自检清单和常见问题解答,最后通过小测检验学习成果,完成可获得"图形化小能手"徽章。教学注重实践,为后续AI互动游戏开发奠定基础。

2025-09-29 21:37:19 253

原创 第二课(零基础友好版)|计算机与网络安全小常识 + 超详细 Scratch 实践步骤(五年级)

《计算机与网络安全小常识》是为五年级学生设计的自学课程,通过Scratch编程实践学习网络安全知识。课程包含认识个人信息、创建强密码、制作两个Scratch项目(安全信息分类游戏和两步验证模拟器)等内容,时长70-90分钟。学生将学习5条网络安全规则,掌握口令句设计方法,完成项目后需签署家庭上网公约并参与小测试。课程提供故障排查指南和进阶挑战,完成者可获得"网络安全守护者"徽章。该课程将安全知识与编程实践结合,适合家庭或学校使用。

2025-09-28 21:23:20 73

原创 第一课|认识 AI + Scratch 初体验(自学版,五年级)

《AI与Scratch编程初体验》是为五年级学生设计的60-75分钟编程启蒙课程。课程通过三个目标展开:认识AI应用(如人脸解锁、语音助手)、学习Scratch基础操作(制作会打招呼和移动的小猫程序)、了解网络安全(不泄露个人信息)。课程包含两个实践项目:基础版"打招呼小猫"和进阶版"碰撞检测游戏",通过积木编程培养逻辑思维。配套提供离线版软件下载和安全提示,最后通过选择题和实操测试巩固学习成果,为后续AI识别功能学习打下基础。

2025-09-28 21:01:37 98

原创 专为五年级小朋友设计的《AI 编程入门》基础教程目录(16 课时,建议每课 60–90 分钟)。每节都给出目标、关键词、工具与产出,便于直接用来备课或自学

《AI与编程启蒙课程摘要》 本课程通过16个模块循序渐进地引导学生探索人工智能与编程:从认识AI基础概念(分类、预测)到Scratch图形化编程(顺序/循环结构),再到机器学习实践(Teachable Machine训练图像/语音模型)。课程融合理论与实践,包含躲避游戏设计、手势控制相机、语音指令游戏等趣味项目,同时探讨数据偏见、隐私安全等伦理问题。最终通过Python基础体验和综合项目开发,培养学生计算思维与AI应用能力,强调"数据-训练-测试"的机器学习逻辑,完成从认知到创造的完整学

2025-09-28 20:54:09 118

原创 在 openEuler 上排查 Docker 同桥网络不通:从“全线超时”到定位容器没启动

摘要: 在openEuler 24.03上部署Docker容器集群时,出现同桥网络不通问题。通过排查发现,核心原因是openEuler特有的桥与防火墙联动机制(bridge-nf-call-*)阻断了容器间通信。修复步骤包括:关闭桥层过滤(sysctl调整)、放开防火墙规则(firewalld/iptables)、禁用反向路径过滤(rp_filter)。网络恢复后,进一步发现OpenWebUI容器因未启动导致8080端口不可用。最终总结为:先解决系统层网络拦截(openEuler桥防火墙联动),再检查应用层

2025-09-26 11:44:52 902

原创 记一次「Failed to initialize NVML」故障排查:从版本不一致到系统干净收尾

摘要: 本文记录了Ubuntu 22.04系统下因NVIDIA驱动版本不一致(内核模块570.133.20与用户态库570.172.08)导致nvidia-smi报错Failed to initialize NVML的排查过程。修复方案选择升级内核模块至570.172.08以匹配用户态版本,通过apt install指定版本并重建引导。过程中因apt autoremove触发MySQL未初始化问题,需清理或初始化MySQL以恢复apt流程。最终通过版本对齐和系统重启解决问题,并总结了版本检查命令和驱动升级的

2025-09-24 18:05:34 1119

原创 断电后 yum/dnf 报 “BDB0113 / BDB1507 / DB_RUNRECOVERY”:一次彻底修复手记

摘要: 本文详细记录了断电导致yum/dnf报"BDB0113/BDB1507/DB_RUNRECOVERY"错误的修复过程。核心原因为RPM数据库(rpmdb)因异常断电损坏,涉及BerkeleyDB锁文件残留或索引问题。修复分三步:终止占用进程→清理锁文件→重建数据库索引(rpm --rebuilddb),必要时重建主库(保留已安装软件)。提供一键修复脚本及预防建议(如UPS保护、定期备份)。修复后需优先恢复rpmdb,再处理业务软件(如Docker)安装。适用于CentOS/RHE

2025-08-26 14:40:16 552

原创 解决 VSCode 运行 Python 时 ModuleNotFoundError: No module named ‘open_webui‘ 问题

在VSCode调试Python项目时,模块导入错误通常是由于Python搜索路径未包含项目目录。解决方法是在.vscode/launch.json配置文件中设置工作目录和环境变量,具体步骤包括:创建配置文件、添加调试配置(指定程序路径、工作目录和PYTHONPATH)、保存并测试运行。这种方法能有效解决ModuleNotFoundError问题,且不影响全局环境或项目源码,适用于多入口文件的项目调试。

2025-08-14 11:37:10 743

原创 在 openEuler 24.03 (LTS) 上安装 FFmpeg 的完整指南

openEuler24.03(LTS)安装FFmpeg指南:通过sudo dnf install ffmpeg ffmpeg-devel -y命令即可快速安装FFmpeg及其开发工具包。安装后可通过ffmpeg -version验证,该工具支持视频转码、音频提取等多媒体处理。ffmpeg-devel包含开发所需的头文件和库,适合二次开发。openEuler官方源已内置FFmpeg,无需额外配置,方便开发者直接使用。

2025-08-07 16:38:08 709

原创 解决 GitLab external_url 修改无效的问题:保留数据重新生成配置

摘要:解决GitLab修改external_url无效问题时,通过删除config目录保留数据重新生成配置是最佳方案。操作步骤为:停止容器→删除./config/*→重启容器,GitLab会自动根据docker-compose.yml生成新配置。该方法适用于IP/域名变更后保留原有数据的场景,简单高效,但操作前建议备份。验证时查看gitlab.rb文件中的external_url是否更新,并确认Web界面Clone地址已变更。此方案避免了手动修改配置的复杂性,适合中小规模GitLab环境快速解决问题。

2025-08-04 11:08:44 782

原创 使用 Docker 部署 Label Studio 时本地文件无法显示的排查与解决

Docker部署LabelStudio时遇到本地图片404错误的排查与解决。问题源于环境变量LABEL_STUDIO_LOCAL_FILES_DOCUMENT_ROOT配置为/obs,而同步存储路径为/obs/...,导致拼接错误。提供两种解决方案:1)保持环境变量不变,修改SyncStorage为相对路径;2)将环境变量改为/,保持原始路径。最终采用方案二成功解决,图片正常显示。建议生产环境明确配置文档根路径,确保路径一致性。排查时重点检查容器内文件存在性和环境变量与路径的匹配情况。

2025-08-01 16:00:05 1447

原创 GitLab Docker Compose 迁移后 Redis 权限问题排查与解决

GitLab迁移后Redis权限问题排查与解决摘要:在Docker Compose迁移GitLab时,Redis因权限问题无法启动。原因是容器内UID/GID(997)与宿主机不一致,导致Redis无法访问数据文件。临时解决方案是开放权限(chmod -R 777),长期方案需对齐UID/GID或重建Redis数据。建议迁移前确认权限映射,或使用备份恢复方式避免此类问题。

2025-08-01 14:27:33 935

原创 KubeSphere 集群监控 502 报错排查实录:基于 WhizardTelemetry 的 Prometheus 端点故障与重装方案

摘要:KubeSphere平台中WhizardTelemetry监控组件出现502错误,导致监控数据无法获取。排查发现PrometheusEndpoints为空、Operator权限不足及CR命名空间错位等问题。解决方案包括卸载现有组件、清理残留资源并重装。经验表明命名空间一致性、权限检查及重装是高效恢复监控的关键。通过编写一键排查脚本可快速定位问题,确保监控系统稳定运行。

2025-07-29 11:21:56 987

原创 从 TLS 握手失败到证书统一:一次 KubeSphere Webhook 故障的排查与修复

《KubeSphere Webhook TLS证书故障排查与修复》摘要:部署KubeSphere时出现Webhook TLS握手失败,导致功能异常。故障源于手工替换证书导致CA信任链不一致。解决方案包括:1)安装cert-manager统一管理证书;2)升级KubeSphere启用cert-manager支持;3)清理手工证书配置;4)使用openssl验证服务端证书。经验表明应避免手工证书管理,推荐使用cert-manager统一管理内部证书,并通过调试Pod快速验证证书链一致性。此次排查解决了Webho

2025-07-29 09:52:50 642

原创 手动清理 Kubernetes Completed 状态 Pod 实战指南

Kubernetes Completed状态Pod清理指南 本文介绍如何手动清理Kubernetes集群中已完成的Pod(状态为Completed)。这些Pod通常由Job或CronJob产生,会占用存储资源并影响监控效率。文章提供了多种清理方法:1)直接删除所有Completed状态Pod;2)按前缀筛选特定Pod(如devops-开头的);3)同时清理关联的Job资源。最后建议通过配置ttlSecondsAfterFinished参数实现自动清理,以保持集群整洁并提高运维效率。

2025-07-26 00:30:00 981

ajaxguide Ajax 实用技巧完全指南

Ajax 全称为“Asynchronous JavaScript and XML”(异步JavaScript 和XML),结合 了Java 技术、XML 以及JavaScript 等编程技术,是指一种创建交互式网页应用的网页开 发技术。Ajax 源自描述从基于网页的 Web 应用到基于数据的应用的转换。在基于数据 的应用中,用户需求的数据如联系人列表,可以从独立于实际网页的服务端取得并且 可以被动态地写入网页中,给缓慢的 Web 应用体验着色使之像桌面应用一样。 虽然大 部分开发人员在过去使用过 XMLHttp 或者使用 Iframe 来加载数据,但仅到现在我们才 看到传统的开发人员和公司开始采用这些技术。 就像新的编程语言或模型伴随着更多的痛苦,开发人员需要学习新的技巧及如何 最好利用这些新技术。本技术手册为读者提供了一些很实用的小技巧,如果需要深入 学习 Ajax,读者可以借助其他参考资源。

2011-03-24

fds.swc airfds.swc fds_rb.swc playerfds.swc

包含内容 fds.swc airfds.swc fds_rb.swc playerfds.swc 需要的一看就知道

2010-06-12

birt 项目 配置

下载后,解压,通过Eclipse导入功能导入,由于项目的lib,platform的两个文件夹中的文件比较大,所以请下载 birt-runtime 2.5 网址:http://download.eclipse.org/birt/downloads/ 下载后解压,将birt-runtime-2_5_1\WebViewerExample\WEB-INF中的lib,platform两个文件夹copy到eclipse中的相应的两个文件夹中..能过eclipse发布到tomcat中,运行,访问:http://localhost:8080/birt/,就可以看到项目中已有的例子了.祝你成功,如果运行不了,请发信给我哦.

2010-01-22

HTML+JS自动抽奖系统 适合每人手上有一个号连续的号

这个下载后可以直接使用. 设置一下奖励的数量就行了. 适用于每一个人手上有一个号,连续的号 然后抽奖,抽出来各种名次的奖励

2011-12-08

hbase-0.94.5-security.tar.gz

hbase-0.94.5-security.tar.gz 一看就明白哈

2013-04-24

weibo-phpsdk-v2-2013-02-20.zip

文件:weibo-phpsdk-v2-2013-02-20.zip 晚上好不容易从google code上下载下来,有时google太卡了,急需的亲们可以来这里下载了,只要支付一个积分就行了

2013-05-07

jmxtools jmxri-1.2.1.jar

maven编译时报找不到这两个jar文件,发现已经无法从网站下载了,所以自己在网上找到这两个文件下载,分真贵呀,所以现在便宜分享,2个文件只要一分 Could not resolve dependencies for project ****:jar:0.0.1-SNAPSHOT: The following artifacts could not be resolved: com.sun.jdmk:jmxtools:jar:1.2.1, com.sun.jmx:jmxri:jar:1.2.1: Could not transfer artifact com.sun.jdmk:jmxtools:jar:1.2.1 from/to java.net (https://maven-repository.dev.java.net/nonav/repository): No connector available to access repository java.net (https://maven-repository.dev.java.net/nonav/repository) of type legacy using the available factories AsyncRepositoryConnectorFactory, WagonRepositoryConnectorFactory -> [Help 1]

2014-03-19

jsp在线聊天室源码(很详细)

jsp在线聊天室源码 包括前台和后台管理 非常详细,欢迎大家下载 不下会后悔啊 其中包含公聊和私聊等等 后台包括对前台用户信息的管理等

2010-01-27

jmx-1_2_1-bin,jmxremote-1_0_1-bin,com.sun.jdmk.comm.HtmlAdaptorServer

csdn有一个下载包含HtmlAdaptorServer这个class,不过不知道是不是官方的,而且跟网上介绍的资料不一样,所以自己去oracle官网找着下载下来分享给大家,只要2分啦 包含资源文件为如下: jmx_remote-1_0_1_03-ri.zip jmx-1_2_1-ri.zip 这两个包也是现在网上流行的例子所要求的两个包,即 1、jmx-1_2_1-bin 2、jmxremote-1_0_1-bin 例子网址:http://www.moon-soft.com/doc/39932.htm 其中jmx-1_2_1-ri.zip中的架jmxtools.jar包含下面class com.sun.jdmk.comm.HtmlAdaptorServer 没有分的可以去sun官网找哦,官网下载挺慢的,好不容易下载下来分享啦 http://www.oracle.com/technetwork/java/javase/tech/javamanagement-140525.html

2013-04-24

librarian-chef-0.0.4.gem

librarian-chef-0.0.4.gem 需要的一看便知呀

2015-10-20

jmxremote_optional.jara

jmxremote_optional.jar 当遇到这样的错误时Unsupported protocol: jmxmp使用 将下载的架包放在jdk根目录下面的jre下面的ext下面,类似如下目录 D:\jdk1.7.0_71\jre\lib\ext

2014-11-14

blazeds.war

里面包含 blazeds.war 版本:blazeds-bin-4.0.0.14931 Flex + LCDS + Java 入门教程 在csdn下了一个免费的,报错,所以重新上传一个新并且带上一个简单明了的创建flex工程的教程,希望大家会喜欢.

2010-06-12

WeiboTrends 仿TwitterTrends

这个是获取新浪的数据.学习flex 4.5的好资料哦.下载直接导入项目就可以运行.记得使用flex Builder 4.5

2011-07-03

mysql-connector-java-5.1.6

mysql-connector-java-5.1.12.zip的解压文件中提取的有用jar文件.希望对大家有用. mysql-connector-java-5.1.6-bin.jar

2010-04-13

javamail-1.4.3.zip

2010年2月5日最新的java mail的架。。。。包含Demo与mail.jar文件。使用的时候解压文件,直接取mail.jar文件放到lib并配置即可。。。

2010-02-05

Hadoop in Action 英文版 pdf

Hadoop in Action 英文版 pdf 有目录结构,非常清晰.

2012-03-13

hadoop-1.0.4-1.x86_64.rpm

官网下的,方便日后使用 想要下载的看标题就懂了hadoop-1.0.4-1.x86_64.rpm

2013-04-24

flex4.5.1.chm flex4API文档

flex4API文档 flex3的文档在Adobe网上就可,可是4的一直没找着. 这个Flex4API文档,是根据flex4 SDK生产的,非常权威

2012-02-22

屏幕录像专家

屏幕录像专家注册机各版本通用 下载直接打开输入机器码,也就是你使用屏幕录像专家时显示的机器码,然后再输入一个用户名,就可以生成注册码,填写到屏幕录像专家注册里面就可以啦,超级简单 我在屏幕录像专家V2012 Build1228测试通过的,下载后测试通过的,别忘记回来评价一下哈. 这个注册码我找了好久的,才发现,就共享出来啦,大家意思一下,2个积分啦!

2013-04-18

hive-0.10.0-bin.tar.gz

hive-0.10.0-bin.tar.gz 一看就明白

2013-04-24

openEuler 24.03 全流程实战:用 Ansible 5 分钟部署分布式 MinIO 高可用集群

其中 minio是通过创建密码的形式进行的, 请自行重新创建此文件, 方法 cd minio-ansible ansible-vault create group_vars/vault.yml 创建密码 Vault password 输入密码: sf3yKmdvf***** 回车确认, 要记住此密码哦 然后会弹出一个文件写入界面 按I键 Insert 然后输入你想要的账号密码 minio_root_user: "minioadmin" minio_root_password: "mAtAiL*******" 然后 Esc , :wq 保存 另外自己修改 host.ini 内容为自己的IP 执行安装 ansible-playbook -i hosts.ini deploy_minio.yml --ask-vault-pass 输入刚才让你记住的密码 此文件是实战可用的哦

2025-07-04

jeopardy-tiny.json

下载次资源来自 https://raw.githubusercontent.com/weaviate-tutorials/quickstart/main/data/jeopardy_tiny.json 不方便下载的, 请拿走

2025-03-13

办公软件-开源软件-LibreOffice-25.2.0-Win-x86-64-安装包.msi

LibreOffice 25.2.0 Win x86-64 安装包概述 LibreOffice 25.2.0 Win x86-64 安装包 是一款功能强大的办公软件,它是OpenOffice.org 办公套件的衍生版,同样以Mozilla Public License V2.0许可证免费分发源代码。LibreOffice支持多个文档格式,包括它原生支持的开放文档格式(OpenDocument Format,ODF)外,还支持许多的非开放格式,比如微软的Microsoft Word,Excel,PowerPoint以及Publisher等。此外,LibreOffice还支持扩展功能,其扩展软件库中已经有多个扩展可用。 LibreOffice 25.2.0 Win x86-64 安装包的主要特性 以下是LibreOffice 25.2.0 Win x86-64 安装包的一些主要特性: 自由免费:LibreOffice是一款完全免费的办公套件软件,使用者不需要付费或订阅费用,也无需担心版权问题。同时,LibreOffice还是开源软件,用户可以自由查看和修改其源代码。

2025-02-19

离线镜像 registry.k8s.io/nfd/node-feature-discovery:v0.16.6

Node Feature Discovery (NFD) 解释 Node Feature Discovery 是 Kubernetes 的一个扩展组件,用于检测和记录节点的硬件、软件以及配置特性,然后将这些特性暴露为节点标签,方便用户在部署工作负载时根据这些标签选择节点。 # 将镜像导入本地 Docker 环境 docker load < registry.k8s.io_nfd_node-feature-discovery_v0.16.6.tar # 查看镜像是否已导入 docker images | grep node-feature-discovery

2024-12-18

离线安装 KubeSphere实操记录

manifest-sample.yaml 已按离线方式修改 当前版本 apiVersion: kubekey.kubesphere.io/v1alpha2 kind: Manifest metadata: name: sample spec: arches: - amd64 operatingSystems: [] kubernetesDistributions: - type: kubernetes version: v1.26.12 components: helm: version: v3.14.3 cni: version: v1.2.0 etcd: version: v3.5.13 containerRuntimes: - type: docker version: 24.0.9 - type: containerd version: 1.7.13 calicoctl: version: v3.27.4

2024-12-03

libstdc++.so.6.0.29

nodejs 18在centos7上安装时, 报错需要glibc 2.28, 安装后仍然报错 需要 CXXABI-1.3.9 ./node: /lib64/libstdc++.so.6: version `CXXABI_1.3.9' not found (required by ./node) ./node: /lib64/libstdc++.so.6: version `GLIBCXX_3.4.20' not found (required by ./node) ./node: /lib64/libstdc++.so.6: version `GLIBCXX_3.4.21' not found (required by ./node) node: /lib64/libc.so.6: version `GLIBC_2.33' not found (required by /lib64/libstdc++.so.6) 参见解决办法 https://blog.csdn.net/gs80140/article/details/142141913

2024-09-13

kafka-schema-registry-client-6.2.2.jar

maven 仓库找不到,下载好了,分享出来 报错内容如下 Could not resolve dependencies for project org.apache.flink:flink-avro-confluent-registry:jar:1.15.3: Could not find artifact io.confluent:kafka-schema-registry-client:jar:6.2.2 in maven 安装本地maven mvn install:install-file -DgroupId=io.confluent -DartifactId=kafka-schema-registry-client -Dversion=6.2.2 -Dfile=/root/kafka-schema-registry-client-6.2.2.jar -Dpackaging=jar 官网下载地址 packages.confluent.io/maven/io/confluent/kafka-schema-registry-client

2023-04-25

helm-v3.10.1-linux-amd64.tar.gz

Helm 是 Kubernetes 的包管理器。包管理器类似于我们在 Ubuntu 中使用的apt、Centos中使用的yum 或者Python中的 pip 一样,能快速查找、下载和安装软件包。 部分网络可能下载失败,分享出来

2022-11-01

PRD产品需求说明书模板_v1.2 市场需求文档(MRD)

分享2个模板 PRD产品需求说明书模板_v1.2 市场需求文档(MRD) 亲自用过,感觉还不错的.

2019-06-05

securecrt64位版亲测win10可用.zip

亲测win10可用 按里面的文档说明操作,就没有问题 非常方便

2019-05-12

Star NX-500 针式打印机驱动

Star NX-500针式打印机驱动 网上的下载太乱了, 找到一个靠谱的亲测试可用 , 支持32位,64位操作系统 亲测win10可以使用,Win7可以使用 除了NX-500还包含其它型号的,列举如下 Star AR-1000 Star AR-2400 Star AR-3200+ Star AR-3200II Star AR-5400+ Star AR-6400 Star AR-6600 Star AR-3240II Star AR-100+ Star AR-110 Star AR-200 Star AR-210 Star AR-300 Star AR-350 Star AR-370 Star AR-410 Star AR-500 Star AR-510 Star AR-600 Star AR-650 Star AR-750 下载文件里列举了不能访问的几种解决办法, 主要选择端口是USB开头的端口, 另外打印的时候检查不是不脱机状态,脱机说明USB没连好

2019-10-09

hadoop 2.73 winutils.exe 64位

亲测可用

2017-05-04

好商城v3-b12补丁包

好商城v3-b12补丁包

2015-10-20

Postman-win64-7.1.1-Setup.exe.zip

Postman-win64-7.1.1-Setup.exe 2019年5月最新版本 方便下载不了的亲们下载

2019-05-31

lrzsz-0.12.20-6-x86_64.pkg.tar.xz

使用方法 xz -d lrzsz-0.12.20-6-x86_64.pkg.tar.xz tar -xvf lrzsz-0.12.20-6-x86_64.pkg.tar 然后会解压出来 usr目录 将此目录拷贝到 /usr即可

2019-12-17

MemoryAnalyzer-1.9.1.20190826-win32.win32.x86_64.zip

eclipse的MAT工具,可以对jmap的dump文件进行堆栈分析,导入dump文件时请将dump文件后缀改为bin即可导入 19年10月份最新版本的, 发现官方网站比较难下载

2019-10-03

bosh-lite.tar

bosh-lite.tar

2015-10-20

sysstat-12.3.1.tar.gz

cd /usr/local/src tar zxvf sysstat-12.3.1.tar.gz cd sysstat-12.3.1/ ./configure make make install echo "export PATH=$PATH:/usr/local/src/sysstat-12.3.1" >> /etc/profile source /etc/profile 命令可用 iostat -dk 1

2020-04-07

librarian-chef-0.0.2.gem

需要使用ruby2.0 requires Ruby version >= 2.0.0. 需要的亲看名字就知道了,太难下载了

2015-10-21

git-2.23.0.tar.xz

git-2.23.0.tar.xz 国内下载有时特别慢, 需要快点下载的拿去吧

2019-10-22

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除