- 博客(456)
- 收藏
- 关注
原创 高效快速教你deepseek如何进行本地部署并且可视化对话
随着最近一个新的人工智能deepseek的爆火,很多大佬都开始了在本地进行deepseek的部署操作,并且离线也可以使用,这里的话我就一步一步带你们部署本地的deepseek,说实话这个人工智能的实力不亚于open ai 的gpt。
2025-01-31 12:23:42
31192
138
原创 一文详解Claude Opus 4.7:保姆级使用指南,附入口
2026年4月16日,Anthropic正式发布Claude Opus 4.7。Opus 4.7定价与 Opus 4.6持平,但新版分词器可能导致实际输入消耗的token增长0%-35%。另外,由于思考强度也比4.6高,也会耗费更多输出token。所以在实际体验上,Opus 4.7的总体成本会高一些。本指南将详细介绍Claude Opus 4.7的使用方法、实际发生了哪些变化,以及如何将它的新功能转化为你的日常工作。
2026-04-17 14:31:39
22446
9
原创 基于OpenClaw构建QQ智能机器人系统的全流程技术实现
在人工智能技术高度发展的背景下,将大语言模型(LLM)接入即时通讯工具已成为提升交互效率的关键手段。本文将详细阐述如何利用蓝耘算力平台、腾讯云轻量应用服务器以及OpenClaw开源框架,完成一个具备多模态处理能力的QQ机器人部署。
2026-04-06 15:39:45
26944
180
原创 发现了一种本地AI服务远程管理难题与一种加密隧道解决方案!
现在用着开源大语言模型、Stable Diffusion这类AI工具的人越来越多了,不少开发者都选在自己家或者公司的本地硬件上搭AI服务,比如带显卡的台式机、Linux服务器,还有NAS设备都行。以前常用的端口映射办法吧,不安全;要搭VPN的话,步骤又太复杂,一般人搞不定。今天咱们就聊聊用P2P虚拟组网技术做的那种简单好用的解决办法。
2026-03-22 18:35:41
11227
3
原创 代码审计不用蹲机房!DeepAudit解锁远程办公新方式
cpolar 是一款内网穿透工具,可以将你在局域网内运行的服务(如本地 Web 服务器、SSH、远程桌面等)通过一条安全加密的中间隧道映射至公网,让外部设备无需配置路由器即可访问。广泛支持Windows、macOS、Linux、树莓派、群晖 NAS等平台,并提供一键安装脚本方便部署。DeepAudit 让代码审计更高效精准,cpolar 则弥补了其局域网使用的短板,让审计工具真正实现了移动化、共享化。对于需要灵活办公的开发者和运维人员来说,二者结合能切实提升工作效率,降低协作成本。
2026-03-18 19:03:05
16320
26
原创 Archcraft打造轻量化远程开发环境
Archcraft 作为基于 Arch Linux 的极简发行版,核心功能围绕 “轻量 + 定制” 展开,它摒弃了冗余的桌面环境,仅保留窗口管理器这类核心组件,1GB 内存就能流畅运行,适配 x86_64 架构的旧笔记本、树莓派等设备,十分适合追求效率、喜欢自主定制系统的程序员和 DIY 爱好者,其闪电般的启动速度(约 5 秒)和高度可自定义的操作逻辑,能让使用者根据自身需求搭建专属的开发环境。
2026-03-13 11:31:55
14996
30
原创 打通内网,让Stable Diffusion WebUI随时随地玩转 AI 绘画!
Stable Diffusion WebUI 凭借本地部署的低成本、高自由度,成为不少人进行 AI 创作的首选工具,而局域网访问的限制确实在一定程度上制约了它的使用场景。cpolar 内网穿透的加入,既保留了本地使用的所有优势,又打破了物理空间的限制,让这款 AI 绘画工具真正实现了随时随地可用。
2026-03-10 10:36:20
18142
22
原创 从社死边缘拯救我:用 AR 眼镜打造“亲戚称呼助手“
解决方案无非几种:● 记在手机备忘录:掏手机、解锁、搜索,太慢,而且当着亲戚面查手机很不礼貌● 记在小本本上:更尴尬,像是在做作弊小抄● 让家人提醒:每次都要麻烦别人,不靠谱想了很久,我注意到桌上的 Rokid AR 眼镜。对比维度手机AR 眼镜使用隐蔽性众人可见你在查手机只有自己能看到屏幕内容操作便捷度掏出→解锁→搜索→查看抬眼即见,无需动手社交压力明显在看手机,不礼貌自然地瞟一眼,谁也发现不了响应速度打开APP需要几秒信息即时显示。
2026-03-08 15:48:47
16175
7
原创 告别手动部署!Jenkins让代码构建部署效率翻倍,内网也能远程搞事
*官网(中文):**https://www.jenkins.io/zh/Jenkins是一个开源的自动化服务器,用于构建、测试和部署软件项目。它是一个持续集成(CI)和持续交付(CD)工具,旨在帮助开发团队更快地交付高质量的软件。自动化构建和部署:Jenkins允许开发团队自动化软件项目的构建、测试和部署过程。这意味着当代码发生变化时,Jenkins可以自动触发构建和部署流程,从而减少了手动干预的需要。大量插件支持。
2026-03-06 12:55:11
16723
22
原创 基于 DeepSeek V3.2 与 Go 语言构建智能日志分析系统实战深度解析
在现代运维与软件开发体系中,日志数据是洞察系统健康状态的核心资产。面对海量且非结构化的日志信息,传统的基于规则(Rule-based)或关键词匹配的分析手段往往难以应对复杂的故障模式。随着大语言模型(LLM)能力的飞跃,利用生成式 AI 进行语义级日志分析已成为提升运维效率的关键路径。本文将深入剖析如何基于 Ubuntu 环境,利用 Go 语言的高并发与强类型特性,结合 DeepSeek V3.2 模型的推理能力,从零构建一个流式智能日志分析器。
2026-03-05 10:02:56
42005
182
原创 基于 KaiwuDB社区版 的高并发车联网海量时序数据存储引擎实战:从行业痛点到全链路部署深度解析
在当今数字化转型的浪潮中,智能网联汽车(Internet of Vehicles, IoV)已成为物联网技术最前沿的试验场。随着 5G 通信技术的普及与车载传感器精度的提升,车辆不再仅仅是交通工具,而是演变成了每时每刻都在产生海量数据的移动计算终端。每一辆行驶在道路上的智能汽车,其内部的 CAN 总线、GPS 定位模块、发动机控制单元(ECU)以及环境感知雷达,都在以毫秒级的频率向云端发送状态数据。面对如此庞大的数据洪流,传统的数据存储架构正面临前所未有的冲击。
2026-03-04 22:55:28
40869
4
原创 构建下一代 AIOps 监控系统:基于 Go 语言与 DeepSeek 大模型的深度实践
在云计算与微服务架构日益复杂的当下,传统的基于静态阈值的服务器监控系统正面临严峻挑战。海量的告警噪音与滞后的故障定位能力,促使运维体系向 AIOps(人工智能运维)转型。本文将详细阐述如何利用高性能的 Go 语言结合 DeepSeek 大语言模型,从零构建一个具备智能分析能力的服务器监控探针。我们将深入探讨 Linux 内核信息采集机制、Go 语言并发编程模式以及大模型 API 的工程化集成。本文通过详实的步骤与代码解析,展示了如何从零开始构建一个具备现代 AI 能力的服务器监控系统。
2026-03-04 19:31:36
37937
182
原创 旧电脑也能变工作站?Archcraft让远程开发更丝滑
Archcraft 是一款基于 Arch Linux 的极简发行版,核心功能是用轻量窗口管理器替代传统桌面环境,保留系统运行的必要元素,同时支持高度自定义 —— 从主题到快捷键都能按需求调整。它特别适合追求效率的程序员、喜欢折腾系统的极客,以及手头有旧电脑、树莓派的用户,优点在于启动速度快(约 5 秒)、资源占用低(1GB 内存即可流畅运行),能让老旧设备重新发挥价值。
2026-03-03 12:44:01
15428
24
原创 构建基于Go语言的高性能命令行AI对话客户端:从环境部署到核心实现
在现代软件开发领域,Go语言凭借其卓越的并发处理能力、静态类型安全以及高效的编译速度,已成为构建命令行工具(CLI)的首选语言之一。本文将详细阐述如何在Ubuntu Linux环境下部署Go开发环境,并结合蓝耘(Lanyun)提供的DeepSeek大模型API,手写一个支持多轮对话、上下文记忆的智能终端聊天工具。
2026-03-02 21:19:41
40505
183
原创 实测百灵大模型Ling-2.5-1T:混合线性架构下的全能开发与办公新体验
在当前的大模型赛道中,单纯的参数竞赛已逐渐让位于架构创新与场景落地的比拼。作为国内首个采用**混合线性架构(Hybrid Linear Architecture)**的万亿参数级模型,的发布引起了技术圈的广泛关注。这种架构旨在兼顾Transformer的通用性与线性注意力机制在长文本、推理效率上的优势。本次评测将基于这一核心场域,从开发者视角的代码生成、咨询顾问视角的深度逻辑分析、极客视角的个性化交互,以及高阶用户的API生态接入四个维度,对Ling-2.5-1T进行全方位拆解。
2026-02-28 11:22:07
20382
5
原创 基于 Go 语言与 DeepSeek-V3 构建企业级自动化代码审计系统深度解析
在当前软件工程领域,代码安全性与质量控制已成为DevSecOps流程中的核心环节。随着大语言模型(LLM)技术的飞速发展,利用生成式AI进行静态代码分析(SAST)已成为提升审计效率的重要手段。本文将详细阐述如何在 Ubuntu Linux 环境下,从底层环境构建开始,利用 Go 语言的高并发特性与 DeepSeek-V3 模型的推理能力,开发一款流式响应的自动化代码审计工具。为了实现 JSON 数据的序列化与反序列化,定义了一系列结构体(Struct),利用 Tag 标签映射 JSON 字段。
2026-02-27 19:21:10
45485
183
原创 摆脱距离限制!中兴 F50 随身 WiFi 靠 UFI-TOOLS实现远程智能管控
cpolar 是一款内网穿透工具,可以将你在局域网内运行的服务(如本地 Web 服务器、SSH、远程桌面等)通过一条安全加密的中间隧道映射至公网,让外部设备无需配置路由器即可访问。广泛支持 Windows、macOS、Linux、树莓派、群晖 NAS 等平台,并提供一键安装脚本方便部署。综上,UFI-TOOLS 有效扩展了中兴 F50 随身 WiFi 的功能,而 cpolar 内网穿透则突破了局域网的使用限制,两者结合让 F50 的远程管理变得简单可行。
2026-02-27 10:59:50
15391
24
原创 在 openJiuwen 里把在线小工具搬回本地
摘要: 本文介绍了如何在openJiuwen中将常用在线工具本地化为插件,实现智能体自动调用。首先需确认平台启动正常,创建基础智能体后,重点讲解了插件的开发标准:输入明确、输出稳定、失败可解释,并提供了JSON转换等具体示例。适用场景包括高频使用的固定输入输出工具,而不适合一次性脚本或敏感数据处理。最后强调插件命名应直观可搜索,输出需结构化以便智能体准确识别。通过这种方法可减少网页切换,提高工作效率。
2026-02-14 11:21:33
33062
2
原创 Agentic AI最小可用部署方案:基于 SQLite + ChromaDB 构建 openJiuwen 本地轻量化智能体平台
本文提出了一种轻量化部署Agentic AI平台openJiuwen的方案,采用SQLite+ChromaDB组合替代传统复杂架构。作者指出,在开发初期应聚焦核心功能而非基础设施维护,SQLite能满足配置与状态存储需求,ChromaDB则可简化向量检索流程。文章详细分析了该方案的适用场景,并提供了具体部署步骤,包括SQLite文件准备、ChromaDB集成配置及前后端启动流程。这种最小可用部署方案降低了系统复杂度,使开发者能专注于Agent能力设计和工作流优化。
2026-02-14 11:17:30
20518
原创 击穿膨胀痛点:OpenTeleDB 源码编译与 XStore 引擎极限抗压实录
OpenTeleDB 并非 PostgreSQL 的简单分支,而是针对 PG 生态中 “数据膨胀” 这一核心痛点,在底层存储架构上进行了深度优化。在本次从源码编译到百万级压测的全流程验证中,XStore 引擎在 100% 写入负载下展现出的零膨胀特性,以及稳定线性的 TPS 性能表现,充分证明了其架构设计的成熟度。这一特性对于长期受困于 PG 膨胀告警、业务高峰期性能波动的数据库运维团队而言,具有显著的实践价值。
2026-02-11 14:28:36
40892
3
原创 + cpolar内网穿透,实现AI绘画 如何通过Stable Diffusion WebUI实现内网穿透,在里面进行AI绘画
Stable Diffusion WebUI 凭借本地部署的低成本、高自由度,成为不少人进行 AI 创作的首选工具,而局域网访问的限制确实在一定程度上制约了它的使用场景。cpolar 内网穿透的加入,既保留了本地使用的所有优势,又打破了物理空间的限制,让这款 AI 绘画工具真正实现了随时随地可用。
2026-02-10 11:20:57
14006
19
原创 openclaw新手入门指南:一文看懂环境搭建、模型配置与 WebUI 远程访问
蓝耘 MaaS(Model as a Service)平台提供了兼容 OpenAI 协议的 API 接口,允许开发者通过标准化的 HTTP 请求调用高性能模型,如 DeepSeek-V3.2。此步骤中,底层操作系统已被封装,用户无需手动处理 Docker 容器配置或 Python 依赖环境,直接通过镜像实例化即可获得开箱即用的 OpenClaw 服务端。这种策略允许开发者先完成基础框架部署,随后通过修改配置文件的方式,精准注入前文所述的蓝耘 JSON 配置,规避了向导中对默认 API 端点的强制校验。
2026-02-08 21:08:55
67170
183
原创 破局框架壁垒:深度解析 Ops-Transformer 算子转换层的架构演进
为了应对 AI 领域的快速发展,Ops-Transformer 采用了插件化(Plugin-based)的软件架构,允许用户在不修改核心代码库的情况下扩展算子支持。注册机制(Registry Pattern)利用 C++ 的静态初始化特性,通过宏定义自动将算子转换函数注册到全局 Map 中。解析器解耦针对不同的源框架(TensorFlow parser, ONNX parser),Transformer 提供统一的基类接口,但允许各插件实现独立的解析逻辑。
2026-02-07 16:11:22
244
5
原创 大模型加速核心:Ops-Transformer 算子库技术内幕
除了标准的 Causal Mask(因果掩码),该仓库还支持用户传入自定义的 Attention Mask 矩阵,以支持复杂的稀疏注意力(Sparse Attention)模式或特定的长上下文处理策略,为模型创新提供了坚实的基础。
2026-02-07 16:08:34
234
原创 解构 Metadef:异构计算架构的通用图中间表示 (IR) 与元数据定义
除了标准的NCHW和NHWCmetadefNC1HWC0:专为向量计算单元设计的 5 维格式。FRACTAL_Z:专为矩阵乘法单元(Cube Unit)设计的重排格式。FRACTAL_NZ:用于特定内部传输的高效格式。这些枚举值的存在,使得 Graph Engine 能够在编译期推断出两个算子之间是否需要插入格式转换(TransData)节点,从而实现自动化的数据流优化。
2026-02-07 16:07:58
216
1
原创 掌控张量流动的指挥官:深度剖析 Graph Engine (GE) 图计算引擎的架构机理
为了展示 GE 是如何管理图优化策略的,以下代码片段模拟了 C++ 头文件中对于和Pass的抽象定义。这体现了 GE 架构的可扩展性,允许开发者插入自定义的优化逻辑。// 前置声明class Node;/*** @brief 优化 Pass 基类* 所有的图优化策略(如常量折叠、算子融合)都继承自该类。* 采用了访问者模式或遍历模式对图进行修改。*/public:/*** @brief 执行优化逻辑* @param graph 待优化的计算图指针。
2026-02-07 16:07:25
193
1
原创 构建计算图的通用语:深度解析 Metadef 中间表示层的架构设计
随着 AI 算法的快速迭代,框架内置的算子库永远无法满足所有需求。Metadef 预留了极强的扩展性接口,支持用户通过机制注入自定义逻辑。Metadef 采用了插件化(Plugin-based)OpType 字符串动态解析算子类型不再是硬编码的枚举,而是字符串。这意味着用户可以定义一个名为 “MySuperLayer” 的算子,只要提供了对应的 Metadef 原型定义(Prototype),图引擎就能正确识别并处理它。回调钩子(Hooks)
2026-02-07 16:02:14
151
原创 图引擎 GE 深度剖析:从前端图到硬件执行的“总工程师”
在复杂的异构计算软件栈中,如果说前端框架(如 PyTorch/TensorFlow)是提出需求的“客户”,而运行时(Runtime)是执行任务的“工兵”,那么就是连接这两者、运筹帷幄的“总工程师”。ge仓库是整个 AI 编译流程的核心与大脑,它负责接收上层框架传递的原始计算图,并将其转化为一幅经过深度优化、适配底层硬件的高效执行蓝图。GE 的使命远不止于简单的图遍历。它是一个集图表示、分析、优化、划分和代码生成于一体的复杂系统。本文将带您深入 GE 的内部,揭示其作为编译核心的六大关键技术支柱。
2026-02-07 16:01:47
310
1
原创 深度解码 Metadef:构建计算图的通用“元”语言
以下展示了 Metadef 中用于定义算子原型的结构化概念。// 概念性结构定义:算子原型注册// 这种设计允许编译器在不加载算子实现库(Kernel)的情况下// 仅通过原型库就能完成图的校验与推导public:// 1. 定义算子类型标识符// 2. 声明输入端口与其依赖的数据类型// 3. 声明输出端口// 4. 定义算子特有的属性(如 stride, dilation)// 支持设置默认值与属性类型检查// 5. 绑定 Shape 推导函数,用于静态内存规划。
2026-02-07 16:00:38
252
1
原创 探秘 hcomm 分布式架构:智算集群的通信动脉与内核实现
这是 hcomm 的四肢,负责“数据怎么发”。它定义了一套统一的传输接口(Send/Recv/Write/Read),向下适配不同的物理通道。无论底层是基于 IB Verbs 的 RDMA,还是基于内存映射的 Shared Memory,甚至是 PCIe P2P,在这一层都被抽象为统一的Transport对象。这使得 hcomm 能够在不修改核心逻辑的情况下,快速适配新的互联硬件。为了深入理解 hcomm 是如何维护全局状态的,我们需要查看其核心数据结构的定义。
2026-02-07 16:00:07
182
原创 破局框架壁垒:深度解析 Ops-Transformer 算子转换层的架构演进
为了应对 AI 领域的快速发展,Ops-Transformer 采用了插件化(Plugin-based)的软件架构,允许用户在不修改核心代码库的情况下扩展算子支持。注册机制(Registry Pattern)利用 C++ 的静态初始化特性,通过宏定义自动将算子转换函数注册到全局 Map 中。解析器解耦针对不同的源框架(TensorFlow parser, ONNX parser),Transformer 提供统一的基类接口,但允许各插件实现独立的解析逻辑。
2026-02-07 15:59:12
313
1
原创 深度解析 Ops-Transformer:重塑大模型算子加速的基石
除了标准的 Causal Mask(因果掩码),该仓库还支持用户传入自定义的 Attention Mask 矩阵,以支持复杂的稀疏注意力(Sparse Attention)模式或特定的长上下文处理策略。
2026-02-07 15:58:42
237
原创 极致算力引擎:ops-transformer 深度学习加速库的架构解构与性能优化
在当今的大模型(LLM)时代,Transformer 架构已成为 AI 基础设施的基石。然而,随着参数量从十亿迈向千亿级,通用的深度学习框架算子(如 PyTorch 原生的)在专用 NPU 硬件上往往面临严重的“显存墙”和调度瓶颈。并非简单的算子集合,它是一套专为 Transformer 架构定制的。它通过深度的算子融合(Fusion)、显存分块(Tiling)以及针对特定硬件指令集的微架构优化,将大模型的推理与训练效率推向了物理极限。这是一篇关于的深度技术解构。
2026-02-07 15:58:12
338
1
原创 众核共舞的指挥棒:深度解析 CANN HCCL 集合通信库
为了展示 HCCL 如何抽象通信组与操作,以下代码片段并非用户侧的 Python 脚本,而是 HCCL 底层 C++ 头文件中对于通信域(Communicator)和配置项的结构定义示例。这体现了系统级编程的严谨性。#endif// HCCL 返回码定义,用于精确的错误诊断HCCL_E_PARA = 1, // 参数错误HCCL_E_PTR = 2, // 空指针异常HCCL_E_MEMORY = 3, // 内存分配失败HCCL_E_INTERNAL = 4, // 内部系统错误。
2026-02-07 15:57:25
412
原创 跨越算力孤岛:深入解析 HComm 分布式通信库的高效互联架构
为了展示 HComm 如何在底层抽象复杂的网络环境,以下代码片段模拟了 C++ 头文件中对于通信域(Communicator)初始化的配置结构。这体现了底层库对于物理资源与逻辑分组的严格映射。// 通信链路类型枚举// 定义底层数据传输使用的物理通道LINK_PCIE_P2P = 0x01, // 节点内 PCIe 直连LINK_HCCS_RING = 0x02, // 片间高速互联环LINK_ROCE_V2 = 0x04, // 基于以太网的 RDMA。
2026-02-07 15:56:37
351
1
原创 视觉加速的硬核解构:深入 ops-cv 的图像处理管线
在深度学习的端到端部署中,图像预处理(Pre-processing)往往被忽视,却经常成为制约整体吞吐率(Throughput)的隐形瓶颈。当 NPU 的 AI Core 能够以极高的 FPS 处理矩阵运算时,如果 CPU 还在费力地进行 JPEG 解码或 Resize 操作,整个系统的流水线就会出现严重的“头重脚轻”。ops-cv库的存在,旨在解决这一算力不对称问题。它不仅是一组计算机视觉算子的集合,更是连接通用软件栈与专用硬件加速单元(DVPP/AIPP)的桥梁。
2026-02-07 15:56:05
308
原创 越语言边界:PyASC 运行时桥接与对象生命周期管理
为了展示 PyASC 是如何从底层 C++ 暴露接口给 Python 的,以下代码片段展示了一个典型的 C-Extension 模块结构。这通常是使用 Python C-API 或 pybind11 编写的胶水代码。
2026-02-07 15:49:27
460
原创 硅基底座的神经中枢:深入解构 NPU 驱动与固件开发套件
为了展示 DevKit 是如何在底层抽象物理设备的,以下代码片段模拟了驱动层头文件中关于设备句柄与属性的 C 语言定义。这体现了系统级编程中对于硬件状态的精确描述。// 设备健康状态枚举ASC_DEV_STATUS_HEALTHY = 0, // 设备正常ASC_DEV_STATUS_WARNING = 1, // 存在轻微告警(如温度过高)ASC_DEV_STATUS_ERROR = 2, // 设备发生错误,需复位ASC_DEV_STATUS_FATAL = 3 // 致命硬件故障,需下线。
2026-02-07 15:36:22
434
原创 深度解析 ops-cv:构建高性能计算机视觉算子库的内核之道
在计算机视觉(CV)的落地应用中,图像预处理往往占据了整个推理流程 30% 甚至 50% 的端到端耗时。如果说矩阵乘法是深度学习的引擎,那么图像编解码、缩放、裁剪与色彩转换则是为其输送燃料的管道。任何一环的堵塞,都会让强大的计算核心陷入“无米之炊”的窘境。ops-cv仓库正是为了解决这一瓶颈而生。它不是通用的数学算子库,而是专门针对像素级操作进行了极致优化的垂直领域库。它通过深度挖掘硬件潜力,实现了高吞吐、低延迟的图像处理流水线,是确保视觉 AI 应用流畅运行的幕后功臣。本文将深入ops-cv。
2026-02-07 15:26:49
390
原创 深入 hcomm:构建大规模分布式训练的通信基石
在hcomm的世界里,并非所有设备都需要相互通信。通信总是发生在一个特定的“群组”内,这个群组被称为通信域 (Communicator)。
2026-02-06 19:07:53
224
5
新空间是谁fdff新空间是谁fdff
2026-01-22
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅