- 博客(234)
- 收藏
- 关注
原创 Prisma 计划实录:Doubao-Seed-Code赋予代码「审美力」,想象即落地
在传统的开发流程里,从“视觉灵感”到“代码落地”之间,往往隔着一道厚厚的墙:我们需要切图、量像素、写繁琐的 CSS。很多时候,即兴的灵感就在这个过程中被磨灭了。但这次使用 Doubao-Seed-Code 的经历,让我感觉这道墙被打破了。这不是一篇枯燥的模型能力分析报告,而是我作为一名开发者,与 AI 共同完成一次“视觉重塑”的实录。我尝试抛开那些条条框框,直接把我的手绘草图“喂”给模型,看看在不写一行样式的代码前提下,它能带我走多远。结果是,我们共同完成了一个名为Prisma UI的项目。
2025-11-22 13:58:30
51094
8
原创 CodeBuddy IDE实战:用AI全栈能力快速搭建课程表网页
在数字化开发的浪潮中,工具的革新往往是效率跃迁的起点。腾讯云 CodeBuddy IDE 是 “全球首个产设研一体 AI 全栈开发平台” ,它不仅打破了产品、设计与研发的职能壁垒,更重新定义了 “从想法到落地” 的开发节奏 —— 无需繁琐的工具切换,无需复杂的技术储备,仅通过自然语言交互与 AI 协同,就能让创意快速转化为可落地的产品。而我有幸成为产品的内测体验者,我将从介绍codebuddy核心优势到利用产品打造一个网页深度体验测评 CodeBuddy IDE。
2025-07-23 11:10:42
17762
1
原创 MCP实战|基于 Chatbox AI打造 “任务拆解助手”,告别拖延低效!
Chatbox AI,办公学习好助手。Chatbox AI 是一款 AI 客户端应用和智能助手,支持众多先进的 AI 模型和 API,可在 Windows、MacOS、Android、iOS、Linux 和网页版上使用。Chatbox 软件有多种用途,但作为一个模型 API 和本地模型的连接工具,其主要功能一直都是完全免费的。得益于 Chatbox AI工具的强大,“任务拆解助手”在任务拆解上,展现出清晰的逻辑。将大目标细化为多个可执行步骤,从目标设定到后续跟踪调整,形成完整流程。
2025-06-25 08:00:00
43624
131
原创 调用大模型API打造AI 智能客服系统实践教程
在用户与人工客服的沟通中,等待时间长、需求难满足等问题频发,企业面临用户流失风险,用户渴望快速精准的答案,企业需要“开源节流”、“降本增效”。对此,利用 AI 大模型打造智能客服成为主流解决方案。本次将调用大模型 API,实操构建一个具备知识库的 AI 智能客服系统,有效化解沟通难题。
2025-06-02 12:19:50
13143
177
原创 亮数据与 AI 深度集成:构建电商策略自动化系统新范式
说实话,这次用亮数据搭配AI做电商营销方案,可谓是事半功倍。以前做数据采集,光是应付电商平台的反爬机制,就像在打一场永无止境的攻防战——IP动不动被封,代码改到崩溃,好不容易拿到的数据还乱糟糟的。亮数据与 AI 的深度集成,不仅解决了数据采集的效率与合规问题,更通过 AI 决策引擎将数据转化为可执行的商业策略,形成 “数据驱动策略,策略反哺数据” 的良性循环,这套电商决策自动化系统能够显著提升营销精准度与企业盈利能力,将为电商行业提供可复制的智能化转型模板。
2025-05-07 19:30:25
46531
75
原创 适配国内运营商网络:NAS 异地组网的本土化优化方案实测
针对有更高带宽与隐私需求的用户,支持自建线路功能。技术原理: 用户可将自有公网云服务器部署为私有中继节点,通过官方一键脚本完成部署,账号下所有设备的流量将优先走私有中继;私有节点离线时,自动无缝切换至官方中继节点,实现容灾备份。该模式下传输带宽完全由用户服务器配置决定,且所有转发数据由用户自有节点处理,隐私性更强。部署仅需一行 Shell 命令即可完成全流程配置,相较于自行搭建 frp 中继,省去了编写配置、调试证书、配置防火墙等大量步骤,技术门槛显著降低。
2026-06-24 10:33:15
20062
原创 养宠三年后,我给猫狗专门搭了个“电子病历系统”
养宠物之后,我发现自己的记忆力好像越来越不够用了。什么时候打疫苗、什么时候驱虫、上次体检是什么时候、最近体重有没有变化……刚开始养宠的时候还能记在脑子里,可随着时间越来越长,各种事情慢慢就开始混乱起来。最尴尬的是,每次去宠物医院都会遇到同样的问题。医生问:上一次疫苗什么时候打的?我开始翻微信。医生问:最近体重变化大吗?我开始翻照片。医生问:有没有做过驱虫?我开始努力回忆。很多时候不是不关心,而是真的记不住。后来我发现,人有健康档案,宠物其实也一样需要。
2026-06-20 13:16:43
21389
7
原创 别人做小红书图文要2小时,我把B站视频丢进ClipSketch AI后5分钟搞定了
前段时间为了发一篇小红书笔记,我对着自己录好的视频整整折腾了一个晚上。先找关键画面,再一张张截图,然后调整顺序、拼接图片、补充说明文字。好不容易把图片整理完,文案又成了新的问题。明明视频只有十分钟,可做成图文之后,工作量反而比剪视频还大。后来我发现,很多做自媒体的人其实都在重复同样的动作。一个视频平台发完,再想发到小红书、公众号或者朋友圈时,又得重新整理素材。视频里明明已经有现成内容,却不得不重新做一遍图文版。直到后来刷 GitHub 时,我发现了 ClipSketch AI。
2026-06-12 21:45:26
14748
10
原创 调试邮件功能怕误发真用户?我用MailHog搭了个本地邮件沙盒,零成本随时查看
做 Web 应用开发,邮件功能几乎是标配——注册验证码、密码找回、订单通知,写的时候都得测。但测这件事本身就很尴尬:接真实 SMTP 吧,怕代码 Bug 误发给真实用户, Reputation 受损;不测吧,怎么知道邮件能不能正常收到、样式对不对、标题有没有乱码。行业内有个普遍做法是用日志猜——发出去之后去服务器翻日志,看有没有错误。这种方式效率低不说,日志里出来的信息也很有限,邮件正文有没有错乱、附件有没有带上去,根本看不出来。后来找到 MailHog,算是把这个问题彻底解决了。
2026-06-05 11:31:45
15733
18
原创 群晖装Plex三分钟搞定:套件中心直接装,配好穿透出门也能看片
群晖上装 Plex 比想象中简单太多。之前以为要折腾一堆东西,结果套件中心搜索安装,三分钟不到就跑起来了。群晖的套件生态本身比较成熟,Plex 这类主流工具直接有现成的包,不用命令行,不用改配置,装完打开就能用。唯一需要配的是媒体库路径——告诉 Plex 去哪个文件夹扫电影,刮削器会自动拉海报和简介。然后配合 cpolar 穿透,手机上打开浏览器就能直接看,比任何 APP 都流畅。准备好了吗?让我们从零开始,亲手打造你的私人影音世界。
2026-05-28 20:54:52
17421
14
原创 一天结束想不起干了什么?Traggo 用打标签的方式把时间可视化,比记账还简单
很多人可能有过这种感觉:忙了一整天,晚上回想却想不起到底干了什么。清单上划掉了几项,但那些时间真正花在了哪里、哪些是有效投入、哪些是在瞎忙——完全没概念。时间就这么过去了,下个月复盘的时候还是一片模糊。Traggo 解决的是这个问题。它的逻辑很简单:不给任务打勾,给时间打标签。写代码两小时,打一个 #coding;开会一小时,打一个 #meeting;刷了两个小时手机,诚实地打一个 #摸鱼。每段时间记录下来之后,生成可视化的图表,让你看到时间真正去哪儿了。
2026-05-22 16:07:22
25876
16
原创 给自己的官网装上魔珐星云 Agent:24 小时在线的具身交互助手
而且百元级芯片就能跑,支持千路并发,一个前端工程师就能快速接入,不用组建专业团队。简单说,魔珐星云把具身交互做成了普惠能力,我只需关心访客问什么,剩下的神态、动作、语气,全由魔珐星云 Agent 自动完成。而魔珐星云将具象交互做成通用能力,完美匹配官网日常接待、咨询、答疑等场景需求,用简单开发,就能让官网从静态展示页,变成全天候交互窗口,切实解决官网沟通效率问题。它不用复杂的全流程开发,依托自研文生 3D 多模态大模型,输入文本就能生成完整数字人表演,语音、表情、动作同步联动,像真人一样共情沟通。
2026-05-21 21:27:44
6656
原创 自建 GitLab 私有仓库加内网穿透,代码放家里也能全球访问
代码仓库这件事,大厂用 GitHub、GitHub 私有免费版政策收紧之后更多人转 Gitee,但这两者说到底是把代码放在别人服务器上。有些团队的项目不适合放到第三方平台,代码资产的实际控制权必须在自己手里——这种诉求下,私有化部署 GitLab 是最成熟的解法。在自建 GitLab 这个问题上,技术本身不复杂,社区版免费装,装完跑起来就能用。真正的门槛只有一个:私有部署之后,团队成员不在同一个局域网里怎么访问。总不能每次都让同事连 VPN 或者现场操作服务器,这个使用成本就太高了。
2026-05-16 23:00:05
20813
18
原创 我在服务器上跑了三十年前的《仙剑奇侠传》,顺便把整个DOS时代打包进了Docker
1995年,一个平常的下午。你坐在电脑前,显示器还是那种厚重的CRT,打开C:>,输入GAME\START.EXE,屏幕闪了一下,《仙剑奇侠传》的标题画面出现了。声卡还没配好,只有主板蜂鸣器在响,但那种等待载入的期待感,后来再也没有过。那时候没有图形安装界面,没有steam,没有一键下载。游戏要先塞进软盘,配置声卡要查 IRQ 和 DMA,用笔在纸上记下来,一行一行改config.sys。然后你长大了,那些游戏存在了硬盘的某个角落里,再也打不开了。现在不一样了。
2026-05-08 10:50:03
17936
14
原创 基于腾讯云架构部署OpenClaw并实现与Telegram终端集成的全链路技术解析与实践指南
在当前的后端架构设计与运维实践中,将大语言模型(LLM)能力接入即时通讯终端是一项常规但涉及诸多底层的工程。一旦业务需求涉及到多轮对话的状态保持、多渠道并发处理、高可用重试机制以及严格的接口鉴权,系统的代码复杂度和维护成本会显著上升。OpenClaw作为一个专门处理大模型API调度与多渠道分发的开源网关中间件,在架构层面提供了标准化的解耦方案。
2026-04-29 16:05:21
33139
152
原创 端到端具身智能:破解低延迟、高并发、低成本交互 “不可能三角”
在数字人技术爆发的今天,我们正处于一个认知转折点。很多人认为,只要给大模型穿上一层“数字外壳”,就完成了具身智能的落地。然而,底层架构的平庸往往会让这种尝试沦为昂贵的“电子花瓶”。
2026-04-28 11:21:54
18526
1
原创 Prometheus自定义指标监控:Exporter开发与告警配置实战
Prometheus 本身只解决"抓什么"和"怎么抓"的问题,数据源本身得由你自己来暴露。这是它的设计哲学,也是它的灵活所在——任何能提供 HTTP /metrics 端点的服务,都能成为 Prometheus 的监控目标。所以当有人说"我的业务指标 Prometheus 能监控吗",答案从来不是"能不能",而是"你愿不愿意写一个 /metrics 接口"。这个接口不需要多复杂,符合 Prometheus 的指标格式就行。
2026-04-24 17:26:08
13725
23
原创 无需多软件切换, 实现文档、表格、协作工具一体化
每天在办公室里处理各种文件,打开 Word 写文档、切到 Excel 做表格、再开一个窗口做 PPT,中间还要穿插着局域网聊天、思维导图整理思路,白板讨论完还要手动整理纪要。一台电脑屏幕上开满了窗口,任务栏挤得密密麻麻,找个文件要在好几个目录里翻来翻去,不同格式之间来回转换还经常出格式问题。团队协作更是麻烦,文件传来传去不知道哪个是最新版本,即时通讯和文档工具之间来回切换,一上午真正用来工作的时间没多少。GodoOS 想解决的就是这件事。
2026-04-17 20:15:15
15604
21
原创 MySpeed 自建测速服务器:群晖用户本地网络监控方案
本文介绍如何使用 MySpeed 在群晖 NAS 上搭建私有测速服务器,实现对家庭宽带的 24 小时持续监控。MySpeed 是一款轻量级网络测速工具,核心功能包括上传下载速度测试、历史数据记录、可视化图表展示。通过本地部署,可以消除第三方测速平台服务器距离远、线路优化等问题,获得更真实的带宽数据。使用 MySpeed 自建测速服务器,实测相比在线测速网站,数据更可靠、可追溯,支持定时自动测试、移动端远程访问。适合关注网络质量的家庭用户、需要验证宽带达标情况的个人用户,以及对网络性能有要求的中小企业。
2026-04-10 17:30:23
17920
23
原创 跨网远程访问群晖 NAS 共享文件夹:webDAV+c内网穿透实操教程
本文详细讲解了如何借助 webDAV 和 cpolar 内网穿透工具,实现跨网络远程访问群晖 NAS 共享文件夹。webDAV 可让 NAS 变身可远程编辑管理的 “云盘”,适配多系统且支持权限管控;cpolar 能搭建固定公网地址,解决 NAS 仅局域网可访问的问题。二者结合,可打破网络地域限制,让 NAS 文件随时随地可访问,传输高效又安全。适合人群和典型应用场景:企业跨区域办公的员工、有远程访问家庭 NAS 需求的个人、需要共享 NAS 数据的小型团队;
2026-04-03 18:06:45
16744
19
原创 NAS 部署私人在线修图站:现无订阅修图自由
本文教你把极空间 NAS 改造成私人在线修图工作站,核心是借助开源的 Photopea(被称作 “浏览器里的 Photoshop”),通过 Docker 部署到 NAS,无需 Adobe 订阅、无广告,数据仅存本地。还能通过 cpolar 内网穿透,让你在外也能通过公网访问这个私人修图工具,不管是平板、手机还是电脑,都能随时用专业功能修图,既保障隐私,又摆脱设备和地点限制。什么是Photoshop?
2026-03-31 19:50:14
17032
16
原创 自用超顺手的私有仪表盘:Dashlet 使用体验与部署分享
作为一个常年和各类服务器、应用打交道的运维人,日常总需要在不同网址、不同监控面板之间来回切换,既费时间又容易遗漏关键信息。直到用上 Dashlet,才真切感受到 “一站式掌控” 的便捷 —— 它就像为我量身打造的数字驾驶舱,轻巧又实用。最打动我的是它的轻量化,几十 MB 内存就能稳稳运行,完全不占用服务器资源,而且全程自托管,所有数据都留在本地,不用担心隐私泄露的问题。
2026-03-27 17:35:48
17078
22
原创 搞定 Prometheus 监控盲区:Pushgateway 让临时任务也有可视化数据
做运维和开发的朋友大概率都遇到过这种情况:Prometheus 监控大盘上,长期运行的服务数据一应俱全,但那些凌晨跑的备份脚本、几分钟就结束的 CI/CD 任务、临时调度的数据处理作业,却始终是 “黑盒”—— 这些短命任务执行完就退出,Prometheus 的拉取机制根本抓不到它们的状态。其实不用愁,Prometheus 官方早就给出了解决方案:Pushgateway。这篇实操文,就带大家把这些 “看不见的任务” 纳入监控体系,让每一次临时执行都有数据可查。
2026-03-24 17:32:44
16036
14
原创 闲置 N5105 别吃灰!ESXi+cpolar 让小主机成为全能云服务器
及后缀`的形式了:这里以https访问测试一下:访问成功!这样一个永久不变的域名就设置好了!你还可以穿透其他的系统,比如飞牛Nas的5666端口等等!通过 ESXi 虚拟化盘活闲置 N5105 小主机,搭配飞牛 NAS 实现文件管理,再借助 cpolar 内网穿透打破局域网限制,无需高额成本就能搭建起实用的私有云服务器。这套方案兼顾了实用性与性价比,无论是个人家庭日常使用,还是小型工作室的远程运维需求,都能得到妥善满足,让普通硬件发挥出最大化的使用价值。
2026-03-20 10:51:55
11947
17
原创 在鸿蒙上跑 AI Agent:JiuwenClaw-on-OpenHarmony 完整实战
首次编译产生了67 个 ArkTS 编译错误,全部属于以上 6 类。所有interface改class,嵌套对象拆成独立 class所有对象字面量改+ 逐字段赋值解构改显式索引,spread 改concatJSON Schema 用从字符串构造经验教训:如果从零开始写鸿蒙 ArkTS 项目,建议第一天就把 TypeScript 的"坏习惯"戒掉——不用对象字面量、不用解构、不用 spread。本项目证明了在鸿蒙设备上运行完整 AI Agent 是完全可行的。砍掉 Docker 依赖。
2026-03-17 20:14:30
23367
原创 JiuwenClaw 完整部署 + 飞书接入教程
JiuwenClaw 基于 Python 虚拟环境部署,不污染系统环境、跨平台兼容、配置极简,非常适合新手。接入飞书后,可以把 AI 智能体直接融入日常办公:本地文件操作、数据抓取、Excel 处理、飞书对话问答、任务自动化都能稳定完成。作为轻量易用的 Claw 类本地智能体,是个人与小型团队入门的优质选择。
2026-03-14 18:45:09
25876
2
原创 CANN ATVOSS:赋能 Ascend AI 处理器视频开源智能生态
在人工智能时代,视频数据正以前所未有的速度增长,成为信息传播和智能应用的核心载体。从智能安防、自动驾驶到智慧城市、工业检测,视频智能分析技术在各个领域都展现出巨大的潜力。然而,视频数据的海量性、高维度和实时性要求,使得对其进行高效的编解码、预处理和深度分析,成为一个极具挑战性的任务。传统的处理方式往往难以满足边缘侧和云端日益增长的性能与能效需求。仓库,作为华为CANN。
2026-02-10 16:46:50
300
原创 atvoss:异构计算AI算子自动调优与调度引擎,释放硬件极致性能
metadefatvoss不仅优化了内置算子,更提供了强大的机制,赋能开发者对自定义算子进行自动化性能调优。将自定义算子接入atvoss可调参数的描述:在定义自定义算子时,除了其输入输出和属性,还需要明确指定哪些内部参数是可调的,以及它们的取值范围和约束。调优接口的实现:提供一个接口,允许atvoss能够生成不同的参数组合,并能够调用自定义算子的代码进行性能测试。元定义注册:通过metadef体系,将自定义算子的可调参数信息注册到整个异构计算AI软件栈中。atvoss。
2026-02-10 16:46:18
396
原创 专用 AI 处理器上的虚拟化与资源调度:atvoss 深度解析
atvoss作为 CANN 软件栈中的核心虚拟化与资源调度软件,是实现专用 AI 处理器高效、安全、稳定运行的关键。它通过精妙的资源虚拟化、灵活的调度策略和严格的隔离机制,将物理 AI 处理器资源抽象为可编程、可管理的虚拟设备,从而有效解决了多任务、多用户场景下的资源管理难题。atvoss的存在,不仅大幅提升了专用 AI 处理器的整体利用率和性能可预测性,保障了 AI 工作负载的服务质量,更简化了 AI 基础设施的部署和运维。展望未来,atvoss。
2026-02-10 16:45:47
329
原创 atvoss:AI 处理器上的智能语音与多媒体解决方案,赋能高效实时交互
atvoss中所有算子的正确性与兼容性,都得益于metadef算子原型规范atvoss中的每个音视频处理算子,如 FFT、MelFilterbank、ColorConvert 等,都严格遵循metadef定义的算子原型,包括其输入输出张量、数据类型、形状和格式。形状与类型推导atvoss的算子提供了精确的形状和数据类型推导函数。这些函数在编译时被ge调用,以确保计算图中各张量属性的正确性,并辅助进行内存分配和优化。统一接口:通过metadefatvoss。
2026-02-10 16:45:16
453
原创 CANN OPS-Transformer:赋能大型模型的高效算子库
对于需要实现特定 Transformer 变体或前沿研究的开发者,CANN也提供了扩展能力。TBE / Ascend C 开发:开发者可以利用TBE(Tensor Boost Engine) 或Ascend C语言,基于CANN的算子开发框架,编写自己的高性能 Transformer 算子。Metadef定义与注册:为了让GE识别和调度自定义算子,开发者需要按照的规范,为新算子定义其输入输出、属性和形状推导等元数据。集成到CANN工具链:完成开发和定义后,通过CANN。
2026-02-10 16:43:27
396
原创 使用 ops-transformer 算子库加速大型Transformer模型推理
尽管自定义算子集成:如果模型使用了尚未支持的Transformer变体或自定义操作,开发者可以根据metadef(例如) 中提供的算子定义规范,编写自己的自定义算子并集成到库中。编译参数配置:开发者可以通过编译器提供的接口,配置特定的优化选项,例如:强制使用FP16或INT8精度。启用或禁用某些算子融合策略。针对特定批处理大小进行进一步优化。模型剪枝与稀疏化:结合对稀疏性的支持,开发者可以对Transformer模型进行剪枝,以在保持性能的同时,进一步减少模型大小和推理延迟。
2026-02-10 16:42:54
393
原创 优化 Transformer 算子,赋能专用 AI 处理器高性能计算:ops-transformer 深度剖析
中的所有优化算子,其定义都遵循metadef的规范。算子接口统一中的每个算子都会通过metadef定义其名称、输入、输出、属性、形状推断和数据类型推断函数。这确保了这些专用算子能够被 CANN 生态系统中的其他工具(如模型转换器 ATC、图编译器 GE)正确识别和处理。兼容性保证:通过metadef提供的规范,中的算子能够与 CANN 平台上的其他通用算子和自定义算子保持良好的兼容性。便于扩展:当有新的 Transformer 变体或其核心组件需要优化时,开发者可以参照metadef的规范,在。
2026-02-10 16:42:22
506
原创 Transformer 算子加速:CANN ops-transformer 仓库,深度优化大型模型计算
ops-transformer 并非孤立存在,它深度融入 CANN 软件栈,实现从算子定义到模型执行的端到端优化。开放式框架:ops-transformer 遵循 CANN 的算子开发规范,开发者可以基于此框架,编写针对 AI 处理器的自定义 Transformer 算子 Kernel。元数据注册:自定义算子同样需要提供详细的元数据(通过 metadef 规范),包括形状推导、类型推导等,确保其能被 CANN 编译器正确识别和处理。无缝集成。
2026-02-10 16:41:09
759
原创 Catlass 算子模板库:异构计算核心算力引擎的极致优化秘籍
在深度学习的浩瀚计算需求中,矩阵乘法(GEMM - General Matrix Multiply)扮演着基石般的角色。无论是神经网络的前向推理、反向传播,还是 Transformer 架构中的自注意力机制,都离不开高效的 GEMM 运算。Catlass仓库正是为了在异构计算硬件上实现 GEMM 及其相关融合操作的极致性能而生。它不是一个简单的库,而是一套精巧的算子模板系统,将复杂的硬件特性抽象化,使得开发者能够以更高效的方式驾驭底层算力。Catlass算子模板库在异构计算软件栈中占据了至关重要的战略地位。
2026-02-07 00:09:12
476
原创 Catlass 深度解析:面向异构架构的高性能矩阵运算模板库
Catlass 算子模板库是 CANN 架构中实现深度学习模型高性能运算的核心引擎。它通过精妙的 C++ 模板元编程技术,将极致优化的 GEMM 内核与专用的 AI 处理器硬件特性紧密结合。其在数据布局、混合精度支持以及算子融合方面的深度优化,有效解决了“计算墙”和“访存墙”问题,确保了 Cube Unit 等核心计算单元能够以最高效率持续运行。对于开发者而言,掌握 Catlass 的底层逻辑和优化策略,意味着能够更深入地理解异构计算的本质,并具备开发出针对特定模型和硬件环境的极致性能算子的能力。
2026-02-07 00:09:07
404
原创 Catlass:赋能 AI 处理器极致 GEMM 性能的矩阵模板库
Catlass算子模板库是 CANN 架构中实现高性能矩阵运算的基石。它通过深度融合 C++ 模板元编程的灵活性、对 AI 处理器 Cube Unit 的精细化 Tiling 适配,以及先进的算子融合技术,有效地解决了深度学习计算中的访存和计算瓶颈。Catlass极大地简化了开发者在 AI 处理器上实现极致 GEMM 性能的复杂性,为 AI 模型提供了最直接、最高效的线性代数加速能力。掌握Catlass不仅能够提升算子开发效率,更是释放 AI 处理器强大矩阵计算潜力的关键。
2026-02-07 00:09:03
335
5
原创 深度剖析 CANN Runtime:AI 计算架构的智能调度核心
Runtime 提供了一套完整的机制,允许开发者注册和集成自定义算子。算子开发工具链:通过 Ascend C 或其他自定义算子开发工具,开发者可以针对特定数学逻辑编写高性能的算子实现。算子注册接口:Runtime 提供了 API 接口,允许将编译好的自定义算子动态或静态地注册到算子库中。注册时需要提供算子的输入/输出描述、属性以及执行逻辑的映射。自动调度。
2026-02-07 00:08:51
577
原创 GE 图引擎:异构计算深度学习图优化的核心驱动与智能大脑
算子注册与匹配:GE 维护一个算子库,包含每个算子的输入输出规范、属性列表和默认行为。解析过程中,GE 会将模型中的算子与内部库进行匹配。动态 Shape 与静态 Shape:GE 需要处理模型中可能存在的动态输入形状。对于动态 Shape,GE 会引入动态 Shape 机制,或者在特定场景下将其转化为静态 Shape 进行编译。量化信息:如果模型包含量化信息(如 INT8),GE 会解析这些信息,并在后续的优化阶段利用它们生成量化算子。
2026-02-07 00:08:20
557
原创 异构计算 Runtime 深度剖析:连接软件算法与硬件指令的指挥中枢
Runtime是算子生态的看守者,它不仅提供对官方优化算子(如ops-nn)的调度,更开放了接口,允许开发者通过自定义算子来扩展硬件功能。Runtime为自定义算子的集成提供了一套完整的生命周期管理机制,确保开发者编写的Ascend C代码能够被编译、加载并正确执行。自定义算子在asc-devkit核函数 (Kernel Function):使用Ascend C编写的设备端代码,实现了算子的具体计算逻辑,通常运行在 AI Core 上。它接收作为输入,操作数据,并产生输出。
2026-02-07 00:07:47
792
关于#人工智能#的问题:做模型量化想找同行交流学习
2025-07-24
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅