- 博客(397)
- 收藏
- 关注
原创 高效快速教你deepseek如何进行本地部署并且可视化对话
随着最近一个新的人工智能deepseek的爆火,很多大佬都开始了在本地进行deepseek的部署操作,并且离线也可以使用,这里的话我就一步一步带你们部署本地的deepseek,说实话这个人工智能的实力不亚于open ai 的gpt。
2025-01-31 12:23:42
30962
138
原创 基于C++构建DeepSeek大模型推理SDK:从架构设计到工程落地
在高性能计算与大模型(LLM)应用开发的浪潮中,C++凭借其卓越的内存管理能力和运行时效率,成为了构建底层推理SDK的首选语言。本文将深入剖析如何从零开始,设计并实现一个能够调用DeepSeek模型的C++ SDK。全通过程涵盖了云端鉴权、面向对象架构设计、多态接口封装、单元测试体系构建以及CMake编译系统的配置。
2026-01-28 10:01:25
4142
87
原创 Windows下Qt6+MinGW编译配置libssh2教程:手把手解决SSH开发难题
在 Qt6 中集成 libssh2 是一项涉及跨平台编译、构建系统配置、库依赖管理以及混合网络编程的综合性任务。通过手动编译 libssh2,开发者获得了比 Qt 插件机制更底层的控制权,但也需自行处理 Windows 环境下的路径陷阱、DLL 依赖以及 Winsock 的兼容性问题。本文详尽展示了从源码处理到最终通信成功的完整链路,强调了 CMake 在现代 C++ 工程中的核心作用,并解析了链接阶段常见的符号未定义与顺序错误。
2026-01-27 10:30:00
1067
原创 不再被设备和网络束缚✨VSCode+WSL+cpolar 让开发环境随身走
VSCode+WSL+cpolar 的组合,本质上是为开发者解决了 “开发环境受设备、网络限制” 的核心痛点。它没有复杂的操作门槛,也不夸大功能,只是实实在在地让 Windows 系统下的 Linux 开发环境,能脱离局域网的约束,实现异地访问、跨设备协作。无论是日常通勤时在咖啡厅处理简单的代码调整,还是团队成员共用一套标准化的开发环境减少兼容问题,这套组合都能以平实、稳定的方式满足开发者的实际需求,真正做到让开发环境 “不受限、随身用”。
2026-01-27 08:24:29
17422
原创 Qt常用控件指南(5)
通过对QLabel、QLCDNumber、QProgressBar和QCalendarWidget的剖析,可以看到Qt开发不仅仅是API的调用,更涉及到对事件循环、线程安全、对象生命周期以及渲染机制的理解。掌握这些核心概念,是构建高效、稳定且美观的跨平台应用程序的关键。
2026-01-26 18:45:09
22754
原创 Qt常用控件指南(4)
在Qt Designer的设计环境中,样式表可以通过可视化界面直接应用。对于每一个继承自QWidget的控件,其属性面板中均包含styleSheet属性。开发者可以通过属性编辑器或右键菜单中的“改变样式表”选项调出编辑对话框。在此对话框中输入的样式定义将即时渲染至界面。font-family : '微软雅黑'当样式应用后,设计视图中的控件会立即呈现出相应的视觉变化,这种所见即所得的特性极大提升了界面原型的构建效率。本文系统地介绍了Qt开发中基础控件的使用与定制。从Qt样式表(QSS)
2026-01-25 13:12:05
26925
原创 Qt常用控件指南(3)
鼠标光标是图形用户界面中人机交互最直接的视觉反馈工具。Qt通过cursor属性允许开发者根据当前的应用程序状态(如加载中、禁止操作、指向链接等)切换不同的光标形状。当内置光标无法满足特定的UI设计风格(如游戏或特殊主题软件)时,Qt支持通过图片资源创建自定义光标。首先需准备自定义的光标图片(如.cur或.png格式),并通过Qt资源系统(qrc)导入项目,确保资源路径在编译后依然有效。导入成功后,资源树中将显示该文件,可以通过路径进行访问。在代码中,首先使用QPixmap类加载图片资源。
2026-01-24 16:15:22
5799
原创 躺在家里办公多惬意!node_exporter+cpolar 轻松实现服务器远程监控
node_exporter 作为 Prometheus 生态下的服务器监控工具,核心功能是采集服务器 CPU 使用率、内存占用、磁盘 I/O、网络流量等基础运行指标,适配 Linux、Windows、macOS 等主流系统,无论是个人 NAS 用户、小微企业运维人员,还是技术爱好者都能适用,它的优点在于轻量不占用过多服务器资源,数据采集实时且全面,能清晰反映服务器运行状态。
2026-01-24 15:58:06
10368
原创 Qt常用控件指南(2)
在构建项目时,Qt的资源编译器(rcc)会读取这些文件,将其二进制数据转换为C++源代码(字节数组),并最终编译链接到生成的exe文件中。传递小于0.0的值,会视为0.0。),它成为了嵌入在主窗口内部的一个普通控件,而非独立的窗口实体。本文将深入探讨窗口的几何尺寸获取机制、窗口标题与图标的设置逻辑、Qt资源系统(QRC)的底层原理以及窗口透明度的实现细节。通过上述分析,涵盖了QWidget从基础的几何尺寸认知,到资源管理的最佳实践,再到视觉特效的具体实现,为构建高质量的Qt应用界面提供了必要的技术储备。
2026-01-23 23:05:05
5670
原创 C++大模型SDK开发实录(三):流式交互协议SSE解析与httplib实现原理
在大语言模型(LLM)的应用场景中,用户体验的流畅性至关重要。传统的“请求-等待-响应”全量模式会让用户在模型生成长文本时面临长时间的空白等待。为了实现类似打字机的实时输出效果,我们需要引入流式传输技术。本文将从理论层面剖析适合LLM场景的Server-Sent Events (SSE) 协议,对比其与WebSocket的优劣,并深入讲解如何在C++中使用库实现流式数据的接收与处理。
2026-01-22 21:25:02
19259
4
原创 C++大模型SDK开发实录(二):DeepSeek模型接入、HTTP通信实现与GTest单元测试
在完成了SDK的底层架构设计与抽象基类的定义后,接下来的核心任务是实现具体的模型接入逻辑。本文将以DeepSeek模型为例,详细阐述如何通过C++代码构建HTTP请求、处理API鉴权、解析JSON响应,并通过严格的单元测试验证模块功能的正确性。如果文章中的代码存在问题,可以直接去仓库拉取最新代码在include目录下创建。该文件声明了DeepSeek提供者类,重写了基类中的纯虚函数。可以看到,除了基础的初始化和元数据获取接口外,重点在于(全量返回)和(流式返回)的声明。
2026-01-21 22:08:49
8849
1
原创 Protocol Buffers 深度解析:字段行为、版本迭代与编译选项
在构建高性能、跨语言的分布式系统时,Protocol Buffers(简称 Protobuf)作为一种轻量级、高效的结构化数据存储格式,发挥着至关重要的作用。不仅仅是序列化与反序列化,Protobuf 的设计哲学还深深植根于接口契约的稳定性与演进能力。本文将基于提供的技术文档,深入剖析 Protobuf 在默认值处理、消息更新策略、字段保留机制、未知字段管理、前后兼容性理论以及编译选项优化等核心维度的技术细节,并探讨其在网络通讯录项目中的实际应用。
2026-01-20 19:20:15
7074
原创 MonkeyCode+cpolar,让国产 AI 编程助手随时随地用
MonkeyCode 凭借实用的 AI 代码生成和团队协作功能,为程序员的日常开发提供了切实的便利,而 cpolar 内网穿透技术则弥补了它仅能局域网使用的短板,通过简单的配置就能实现公网访问,让这款国产开源工具的使用场景更广泛。无论是异地团队协作开发,还是向客户展示项目进展,MonkeyCode+cpolar 的组合都能让操作更高效、更灵活,真正发挥出 AI 编程助手的实用价值,也让本地部署的工具突破了网络边界,适配更多元的办公场景。
2026-01-20 13:45:45
23549
原创 极空间NAS远程访问部署深度解析:基于节点小宝的SD-WAN组网实战
在当今数据爆炸的时代,网络附属存储(NAS)已成为个人与企业数据管理的核心枢纽。然而,随着IPv4地址资源的枯竭以及运营商网络架构的复杂化(如大内网IP、CGNAT技术),如何从外部网络安全、高速、便捷地访问位于家庭或公司局域网内的NAS,成为了许多用户面临的技术壁垒。传统的DDNS(动态域名解析)配合端口映射方案往往受到公网IP缺失的限制,而常规的VPN方案在配置复杂度和连接稳定性上存在挑战。
2026-01-20 10:11:24
14577
原创 从 DeepSeek 的服务器繁忙到 Claude Code 全栈交付:2025 年 AI 原生开发实录
2025 年对于开发者而言,是技术范式发生剧烈重构的一年。如果说前两年的 AI 浪潮更多停留在“对话”与“生成”的层面,那么 2025 年则标志着 AI 正式接管了从基础设施部署、协议标准化到全栈代码交付的完整工作流。这一年,技术的边界被打破,基于 Model Context Protocol (MCP) 的生态连接、边缘计算的普及以及智能体(Agent)的深度应用,共同构建了一个全新的开发宇宙。
2026-01-19 21:20:10
16964
1
原创 在 Visual Studio 2019 中配置 Qt 插件开发环境:编译原理 + 底层逻辑解析
在现代 C++ 软件开发领域,Visual Studio 凭借其强大的调试器、智能感知(IntelliSense)以及完善的工程管理系统,被广泛认为是 Windows 平台上最高效的集成开发环境(IDE)。而 Qt 作为一个跨平台的 C++ 图形用户界面应用程序开发框架,以其独特的信号槽机制、元对象系统和丰富的模块库著称。将 Qt 强大的 GUI 构建能力与 Visual Studio 卓越的编码体验相结合,是许多高性能桌面软件开发的首选方案。
2026-01-19 19:42:30
21219
原创 Protocol Buffers C++ 进阶数据类型与应用逻辑深度解析
在构建高效、可扩展的数据序列化系统时,Protocol Buffers 提供了丰富的数据类型以应对复杂的业务需求。除了基础的整型和字符串类型外,掌握枚举、泛型、联合体及哈希映射的使用对于设计健壮的通信协议至关重要。本文将通过构建一个功能完善的通讯录系统,逐步引入并解析这些高级特性的实现细节。在定义协议文件时,枚举类型用于表示一组预定义的常量。然而,在大型项目中,不同模块可能会定义同名的枚举常量,导致 C++ 编译层面的符号冲突。要使用Any类型,必须在.proto文件中导入定义文件。
2026-01-19 19:39:26
11306
原创 C++大模型SDK开发实录(一):spdlog日志封装、通用数据结构定义与策略模式应用
/ 消息结构:对应API中的message对象// 消息内容// 基础配置:所有模型通用的参数// 控制随机性// 控制长度// API配置:继承自Config,增加鉴权信息// 模型元数据:用于服务发现和状态检查// 会话结构:管理对话上下文// 消息历史这些结构体构成了SDK的数据骨架,Session对象将由在内存中维护,并由序列化到数据库中。
2026-01-18 22:33:06
21688
原创 生成对抗网络(GANs)深度解析:从原理、变体到前沿应用
自2014年由Ian Goodfellow及其同事首次提出以来,生成对抗网络(Generative Adversarial Networks, GANs)已成为深度学习领域最引人注目和最具革命性的思想之一。它通过一个巧妙的“对抗”框架,使得模型能够学习并生成与真实数据分布极为相似的全新数据,尤其在图像生成领域取得了惊人的成果。GANs不仅推动了人工智能在创造性任务上的发展,也为无监督学习开辟了新的道路。
2026-01-17 19:48:35
25221
1
原创 Transformer模型:深度解析自然语言处理的革命性架构
自2017年由Google研究人员在论文《Attention Is All You Need》中提出以来,Transformer模型已经彻底改变了自然语言处理(NLP)的格局。它摒弃了以往NLP任务中广泛使用的循环神经网络(RNN)和卷积神经网络(CNN)结构,完全基于自注意力(Self-Attention)机制来捕捉输入和输出之间的全局依赖关系。
2026-01-16 22:51:15
14400
原创 管家婆 + cpolar 让进销存管理随时随地搞定
管家婆作为中小企业进销存管理的核心工具,其本地管理的稳定性和实用性贴合企业日常经营需求,但局域网使用的限制在灵活办公的场景下显得尤为不便。而 cpolar 内网穿透工具的加入,既没有改变管家婆原本的操作逻辑和数据管理模式,又通过安全的网络穿透方式,实现了管家婆的远程访问。这种组合让企业的财务、库管、管理人员能摆脱办公地点的约束,比如外出谈单时查库存、居家时处理对账、异地时维护系统,都能高效完成,既保障了数据安全,又提升了工作的灵活性,真正让进销存管理适配企业的实际运营节奏。
2026-01-16 11:41:50
13963
原创 智界·无界:高德开发者生态大会深度观察与技术巡礼
照片中展示的正是这样一个充满活力的互动瞬间,参与者们专注于屏幕上的交互体验,探索着技术落地的各种可能性。大会在热烈的掌声中圆满落幕。走出通过屏幕构建的虚拟世界,回到现实,每一位开发者都带走了新的知识、新的灵感以及对未来的无限期许。这个奖项不仅包含荣誉,更包含实质性的资金支持,这将助力该项目后续的研发与落地,让技术真正走出实验室,服务于需要帮助的视障群体。在地理信息系统(GIS)与移动互联网深度融合的当下,高德地图作为行业内的基础设施提供者,其开发者生态的动向往往预示着位置服务(LBS)技术的下一个风口。
2026-01-15 21:12:20
20357
34
原创 3 分钟搭专业文档站!Docsify+cpolar,笔记、教程外网随时看
Docsify 是一款轻量级文档网站生成工具,能直接将 Markdown 文件转换成带目录、搜索、代码高亮的在线文档,无需构建编译,修改后保存即生效。它适合技术团队维护 API 手册、教师整理课程资料、个人搭建学习笔记库,优点是零配置上手快、全平台兼容,手机和电脑都能流畅访问,且无需掌握专业前端知识。使用时能感受到它的便捷性,但也有小细节需要注意:建议用清晰的文件夹结构管理 Markdown 文件,方便后续查找;默认侧边栏和封面足够日常使用,过度定制插件可能增加维护成本;
2026-01-13 15:25:22
13917
原创 基于Docker的SD-WAN组网方案:利用节点小宝实现服务器远程开发
构建安全高效的异地组网环境是现代云服务器运维与远程开发的核心需求。通过容器化技术部署节点小宝,能够利用 SD-WAN 技术在不同物理网络环境下的设备之间建立虚拟二层或三层网络,实现内网穿透与异地局域网互联。本文将深入解析基于 Docker 的部署流程、网络模型配置及实际应用场景,通过标准化步骤实现从环境检测到安全加固的全链路操作。
2026-01-13 09:30:14
27311
原创 全栈智能化开发:深度解析 Claude Code 与 Ui-Ux-Pro-Max Skill 的协同构建体系
在软件工程的演进历程中,AI 辅助开发已从简单的代码片段补全跨越至全链路的自动化构建。Anthropic 推出的 Claude Code 代表了这一领域的最新突破,它作为一个驻留于终端的智能代理,能够理解复杂的文件系统与项目架构。结合 UiUxProMaxSkill 这一特定领域的专家级技能包,开发者能够在极短时间内构建出符合工业级设计规范的 SaaS 系统。本文将深度剖析从凭证获取、环境净化、核心引擎部署、技能注入到最终产物交付的全过程,详细阐述每一环节的技术逻辑与操作细节。在使用任何基于大语言模型的开发
2026-01-12 23:11:56
36406
1
原创 代码随走随写!Jupyter Notebook+cpolar 让你的编程工作台 “装进口袋”
Jupyter Notebook 是一款能将代码、文字说明和图表无缝融合的工具,支持 Python、R 等 40 多种语言实时运行,就像一个 “会计算的笔记本”。它特别适合数据分析者做模型迭代、学生写编程作业、老师做代码演示,优点在于能边写代码边记录思路,结果实时可见,团队还能共享文件一起修改,比单独用文档加代码文件高效多了😊。用 Jupyter 时发现,它的 “实时演算” 功能很实用,比如写数据分析代码,输完一行就能看到图表结果,不用等全部写完再调试。
2026-01-09 18:13:09
23657
40
原创 0基础如何搭建个人博客?GMSSH可视化运维工具配合WordPress部署全流程教学
在当前的互联网基础设施运维领域,服务器的管理效率与安全性始终是核心命题。传统的基于命令行界面(CLI)的操作模式虽然功能强大,但对于大规模集群管理或追求极致效率的开发者而言,存在着认知负担重、可视化程度低以及操作容错率差等痛点。GMSSH作为一款轻量级可视化服务器管理工具,通过集成安全SSH隧道、终端与桌面双模式以及丰富的容器化应用管理功能,为服务器运维提供了一套全新的解决方案。其核心设计理念在于将复杂的服务器操作转化为直观的图形化交互,从而实现对多台主机的轻松掌控。
2026-01-06 14:02:14
41678
5
原创 手残党也能画好流程图?Excalidraw+cpolar,远程协作超顺手
Excalidraw 是一款主打手绘风格的电子白板工具,能轻松画思维导图、架构图、会议记录,线条会自动平滑但保留手写质感,还支持实时协作和导出 PNG、PDF 等格式。它特别适合学生做笔记、职场人开脑暴会、设计师画原型 —— 哪怕没绘画基础,也能快速上手出图。优点在于操作极简,能插入文本、公式甚至代码块,从涂鸦到正式配图无缝衔接。实际用下来,它的 “协作分享” 功能很惊艳。和同学一起做项目时,甩个链接对方就能在线补充内容,比来回发图片高效多了。
2026-01-06 13:59:10
24101
36
原创 基于腾讯云对象存储 COS 与 PicGo 的 Obsidian 自动化图床方案深度实践
在数字化创作的过程中,由于博客文章数量持续增长,网页加载性能受限的问题日益凸显。当文章包含大量高分辨率图片时,传统的本地存储模式会导致访问延迟增加。在跨平台发布(如 CSDN、知乎或独立博客)时,本地图片路径无法直接适配互联网环境,手动逐张上传不仅效率低下,且极易触发图片链接失效或丢失的风险。为了解决这些核心痛点,建立一个稳定、高速且具备自动转换功能的图床系统成为技术创作的刚需。
2026-01-05 22:13:57
24403
1
原创 Drawnix 开源白板:画画、协作全搞定,但想远程用?cpolar一招破解!
Drawnix 是一款功能全面的在线白板工具,集思维导图、流程图绘制、自由涂鸦于一体,支持自定义颜色、字体和线条,还能多人实时编辑。无论是头脑风暴的团队、规划课程的老师,还是记录灵感的设计师,都能靠它梳理想法、可视化内容。作为开源工具,它免费且可高度定制,操作界面直观,即使是新手也能快速上手,完全能替代不少付费协作工具。用 Drawnix 画流程图时特别顺手,工具栏分类清晰,拖拽式操作比传统软件更流畅,保存的文件还能导出成图片分享。
2025-12-31 08:45:58
21658
1
原创 Qt常用控件指南(1)
Qt 中的各种控件都直接或间接地继承自QWidget类。在 Qt Designer(Qt 设计师)中,通过属性编辑器可以看到QWidget包含的大量属性,这些属性决定了控件的外观、行为以及与系统的交互方式。上图展示了 Qt Designer 中的属性编辑面板。开发者可以直接在界面右侧的属性栏中修改各个参数,包括控件的名称、坐标、尺寸、字体以及各种状态策略。这种可视化编辑方式极大地提高了 UI 开发效率,而其背后对应的则是QWidget类提供的 API 接口。: 返回控件当前的可用状态。
2025-12-30 10:06:28
26275
1
原创 用 Archcraft 搞开发?加个 cpolar,远程调试再也不用扛电脑
Archcraft 是一款基于 Arch Linux 的轻量级系统,用窗口管理器替代了臃肿的桌面环境,内存占用低、响应速度快,特别适合程序员、嵌入式开发者等需要高效终端操作的人群。实际用下来,它的自定义布局很灵活,能同时开多个终端窗口调试代码,但对新手不太友好,需要花时间熟悉命令操作。不过它有个明显局限:默认只能在局域网内使用,要是想在家远程连接公司的 Archcraft 开发环境,或者在外调试设备上的程序,就只能依赖复杂的端口映射,成功率还不高。
2025-12-26 15:56:21
19681
原创 一个牛逼的Edge插件,国内直接用Gemini 3,NanoBanana2,GPT 5.2
经实测,只花了3分钟不到,DeepSider接入的Gemini 3.0 Pro就成功跑出了完整的1600多行代码!DeepSider的特点就是专为中文用户设计,没有网络门槛,装上就能随时在侧边栏与AI对话,生成图片或视频。可以看到,Gemini 3.0 Pro正确地理解了用户要求,动画也很流畅,代码中几乎没有Bug存在。以Edge浏览器为例,进入插件安装页面后,点击获取按钮,就可以安装DeepSider插件了。不过,虽然Gemini 3.0 Pro好评如潮,但对于国内用户来说,使用起来并不容易。
2025-12-26 12:26:12
21502
1
原创 企业级数据抓取进阶指南:深度解析IPIDEA自动化解决方案与实战应用
在数字化转型浪潮中,数据资产的获取能力直接决定了企业的竞争边界。作为全球领先的数据采集基础设施提供商,IPIDEA不仅提供了稳定的网络代理服务,更构建了一套完整的、面向开发者的自动化抓取生态体系。官网主页展示了其核心定位。IPIDEA提供的不仅是静态的IP资源,而是一个集成了全球住宅IP、数据中心代理及专项爬虫API的综合平台。其界面逻辑清晰,强调了“全球覆盖”与“较高稳定”的技术特性。对于需要大规模获取海外市场数据的企业而言,这种基础设施的完整性是确保业务连续性的基石。
2025-12-25 14:24:41
63721
1
原创 节点小宝4.0:远程连接技术架构、交互逻辑与功能模块深度解析
4.0版本明确了两个核心应用场景:数据管理与实时控制。这张图对比了节点小宝 4.0 与 3.0 版本的界面差异:4.0 版本新增了 “远程文件”“远程原生桌面” 功能模块,同时保留了 “相册备份”“穿透组网”,分类更贴合用户场景:查资料用 “远程文件”,操控电脑软件用 “远程原生桌面”;3.0 版本仅显示 “组网运行中” 状态,功能模块较少,主要呈现 “mysql 智能助手”“组网数”“内网穿透流量” 等基础信息。这种设计消除了工具冗余,使用户在打开App的第一时间就能根据需求做出选择。
2025-12-25 09:04:20
33038
原创 Protobuf 序列化协议深度技术白皮书与 C++ 开发全流程指南
序列化(Serialization):指将内存中的结构化对象(Object)转换为字节流(Byte Stream)或特定格式(如 JSON 字符串、XML 文档)的过程。其核心目的在于使内存对象能够跨越进程边界,进入存储介质(磁盘)或网络传输链路。反序列化(Deserialization):指将序列化后的字节流或格式化数据重新恢复为内存中原始对象的过程。此过程必须保证数据逻辑的完整性与类型的准确性。// 首行:语法指定行// 命名空间声明// 联系人 message 的定义// 姓名// 年龄。
2025-12-24 21:48:24
19826
1
原创 拒绝转圈圈!AI Ping 注入 Coze,带你瞬发体验限免版 GLM-4.7 与 MiniMax-M2.1
维度GLM-4.7核心长板深度编程逻辑、后端架构优化Agent 任务编排、多语言协作心流体验极速代码补全,逻辑连贯性极强复杂的指令响应,多步骤任务不卡顿推荐场景解决 C++ Bug、重构算法、技术博文撰写搭建 AI 助理、多语种翻译、自动化运维算力性价比极高,配合 20 米奖励可长期自测高,适合作为 Agent 的常驻后台> 追求极致编程爽感的开发者,请闭眼入GLM-4.7;想要探索 AI Agent 边际、构建跨平台工具的开发者,是你的不二之选。
2025-12-24 15:27:10
1034
1
原创 openEuler 系统想远程管理?不用公网 IP 也能轻松实现,方法在这!
openEuler 是一款聚焦多样性计算的操作系统,支持服务器、嵌入式设备和云计算环境,安全性和稳定性都不错,很适合企业在智能驾驶、金融业务等关键领域使用,开发者也常用来搭建测试环境。它的模块化设计让适配不同硬件变得简单,内核优化也能保障任务可靠运行。使用 openEuler 时,发现它对硬件兼容性挺强,但远程管理起来有点麻烦。比如在调试嵌入式设备时,必须在局域网内操作,一旦离开这个环境,就没法实时查看状态,对多场景协作不太友好。
2025-12-23 16:14:22
24429
1
原创 手把手带你用MindSpeed-MM在昇腾910B上训练Qwen-VL:从环境搭建到Loss收敛
坑确实有,但路已经通了。相比于一年前还要自己手写算子适配,现在 MindSpeed-MM 基本上把脏活累活都干完了。对于想在国产算力上布局多模态大模型的团队来说,这绝对是目前最佳的切入点。几个核心建议:环境隔离:不同版本的 CANN 包尽量用 Docker 隔离,不然环境变量会教你做人。数据质量:多模态模型对数据非常敏感,清洗逻辑比调参更重要。关注社区的更新频率很高,遇到问题多去 Issue 区看看,很多时候是因为代码没拉到最新。下一步,我准备研究一下 MindSpeed-MM 里的。
2025-12-23 15:44:48
10744
1
原创 昇腾NPU适配Apex避坑指南:从编译失败到顺利安装
通过这个指南,从为什么用Apex Patch到安装和问题排查,我们基本掌握了流程。整个过程其实最容易卡在环境依赖版本不匹配和编译时的路径设置上。作为开发者,装好Apex不只是步骤,还能帮你加速AI训练。从原理到实际,试试看。昇腾NPU在兴起,Apex Patch能帮大忙,赶紧克隆仓库上手吧!注明:昇腾PAE案例库对本文写作亦有帮助。
2025-12-23 15:44:00
8801
1
新空间是谁fdff新空间是谁fdff
2026-01-22
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅