- 博客(75)
- 收藏
- 关注
原创 高可用虚拟IP(HaVip)技术详解:原理、设计与应用
HAVIP(High-Availability Virtual IP)是一种由云平台(如腾讯云、阿里云)分配的内网IP地址,其核心功能是确保在主备服务器故障切换过程中,对外服务的虚拟IP地址保持不变,从而避免业务中断。它并非独立品牌产品,而是云计算基础设施中的技术组件,英文全称为“High-Availability Virtual IP”,中文直译为“高可用虚拟IP”。HaVip功能为用户搭建高可用服务集群提供了方便,提升服务的可靠性、稳定性。
2026-03-12 15:15:13
180
原创 给OpenClaw戴上“安全锁“:AI沙箱基于E2B的硬件级隔离实践
AI沙箱是为AI模型、应用或智能体(Agent)提供安全可靠的运行环境,用于执行不可信的代码、文件或访问未知的网站/应用。其核心目标是安全的分析潜在威胁(如恶意软件、漏洞利用、网络钓鱼)或安全的运行不受信任的程序/脚本,防止其对真实系统造成损害。它通过虚拟化技术(如轻量级虚拟机MicroVM)构建隔离环境,让AI系统在其中执行代码、访问资源、与应用交互时,完全与外部生产系统隔绝。
2026-03-09 18:25:21
396
原创 智能体对话AIMI课程上线:从入门到实战,打造能听会说的智能客服
360智汇云是一套面向业务系统的,融合语音、图像、文本与数字人表达能力,通过一键配置,快速构建更自然、更可信、更具服务感的智能客服体验,显著降低企业部署与开发成本。智能体对话AIMI产品使用地址:https://zyun.360.cn/product/aimi。
2026-03-05 19:03:15
215
原创 一个被忽视的CPUID,如何悄悄吞掉你的IOPS
上图为有hypervisor指令集时,宿主机的KVM Perf数据,HLT占比14.67%(-8%),PAUSE_INSTRUCTION占比15.07%,EXTERNAL_INTERRUPT占比8.93%,MSR_WRITE占比60.94%(非hypervisor指令集下使用APIC_WRITE,是老旧CPU架构下的xAPIC中断模式,使用mmio方式,MSR_WRITE是新架构下的x2APIC中断模式,使用MSR寄存器,x2没有APIC和mmio的数量限制)。HLT模式:看似省电,实则昂贵。
2026-03-03 17:31:06
386
原创 让 AI 可见 :智能体对话全面升级数字人能力
• 专属形象及人设• 可承载企业品牌、岗位身份与业务角色• 打造真正的“数字员工”与“数字代言人”在智汇云-智能体对话-项目管理菜单,新建项目,选择「数字人通话」
2026-02-05 19:13:37
641
原创 Pika 强一致性的实现
Pika Raft 模式是 Pika 新增的分布式一致性功能,基于braft库实现了完整的 Raft 共识协议。相较于原有的主从复制模式,Raft 模式提供了强一致性保证自动故障转移和成员动态管理等能力,适用于对数据一致性要求较高的生产场景。
2026-02-04 14:53:57
839
原创 Lustre 与 PoleFS :架构设计、文件分布与特性比较
Luster是一款高性能并行分布式文件系统,其构建了一套高性能并行分布式存储架构,其客户端以内核模式运行,能够直接与元数据服务节点(MDS)及对象存储节点(OSS)建立通信,消除了用户空间与内核空间的切换开销。配合高端存储硬件,Lustre 在大带宽输入输出场景中呈现出优异的性能表现。
2026-02-02 15:51:47
676
原创 智汇云API市场:智能文档解析服务
✅百页级文档高效解析✅复杂版式高精度识别✅表格公式精准还原✅高并发稳定处理✅企业级架构保障✅API 快速集成。
2026-01-30 16:12:06
783
原创 从当下窥见未来,AI技术资讯合集
尽管取得了这些进展,基于 LLM 的智能体在复杂的多步规划任务中仍然表现不佳,经常出现违反约束、状态跟踪不一致以及解决方案在微小变化下就会失效的脆弱性问题。与人类的科学推理、经典的人工智能规划以及决策的认知模型不同,当前的 LLM 提示范式允许推理在一个隐式且不稳定的任务内部模型上进行。graphrag-workbench是基于微软GraphRAG框架的一个交互式Web应用,用来构建和可视化知识图谱,它适合需要可视化复杂关系或进行AI辅助分析的场景用,比如说,做研究、商业情报、小说剧本理人物关系等等。
2026-01-22 16:20:33
615
原创 一文读懂 API 安全防护的关键密码
在人人离不开手机 APP、小程序的今天,API如同连接用户与系统的隐形桥梁,承载着登录信息、支付数据、个人隐私的传输。一旦 API 出现安全缺口,攻击者便会趁虚而入,窃取数据、发起攻击,给个人和企业造成巨大损失。这也让我们意识到:API 安全绝非开发者的私事,而是关乎每个人的数据安全。作为承载交互数据的核心,API 接口需为数据安全访问提供最终支撑与保障。就让我们来聊聊API接口安全的问题。API 安全无小事,其防护工作并非一蹴而就,而是一项贯穿系统开发、测试、运维全流程的长期任务。
2026-01-20 15:23:07
609
原创 驱动AI落地:AI评测TEP平台功能全解析
360智汇云AI评测平台应运而生,通过集成自动化评测、手动评测、数据集管理与性能分析等核心功能,为企业提供了客观的显化决策依据。
2026-01-19 17:36:30
674
原创 放心让AI写代码了,AI沙箱上线!
AI沙箱是一款专为AI开发场景设计的新一代运行时基础设施,提供了一个安全隔离的云端沙箱环境来执行AI生成的代码。这种沙盒环境可以防止AI程序访问或篡改系统之外的资源,确保其行为不会对系统造成损害。访问地址:https://console.zyun.360.cn/sandbox操作手册:https://zyun.360.cn/developer/docnew?沙箱实例:提供快速创建沙箱入口,展示当前运行中的沙箱实例,支持根据沙箱ID搜索查找对应的沙箱。
2026-01-15 16:33:39
586
原创 HULK PostgreSQL 图数据库化方案:Apache AGE 的引入与实践
PostgreSQL 擅长事务型数据管理。Apache AGE 通过扩展方式将图数据库能力引入 PostgreSQL,使其在保持原有稳定性与生态优势的同时,补齐了图数据建模与查询能力的短板。这种“关系型数据库 + 图模型”的融合架构,为需要同时处理强事务与复杂关系的数据场景提供了一种务实且高性价比的技术路径。
2026-01-13 15:34:55
739
原创 基于Go Channel实现的高性能消息发送WorkerPool
Channel的核心特性:缓冲Channel实现任务缓冲与流量削峰,无缓冲Channel实现同步通信,嵌套Channel实现精准的任务分发;底层依赖hchan结构体、环形队列、等待队列和互斥锁,完成数据拷贝与Goroutine的阻塞/唤醒调度。WorkerPool的实现范式:通过管理空闲Worker,结合信号量Channel实现动态扩缩容,通过panic捕获+故障Channel实现Worker自愈;底层通过减少锁竞争、优化Goroutine调度,提升并发效率。工程化要点。
2026-01-07 14:55:16
404
原创 Pulsar 消息重试与死信机制
发送到 Retry Topic:消息被发送到 Retry Topic,并设置 deliverAfter(delayTime, unit) 延迟投递自动 ACK:发送成功后,通过 doAcknowledge() 自动确认原始消息原消息状态:原始 Topic 中的消息变为已确认(Acknowledged)状态延迟重试:延迟时间到达后,消费者会从 Retry Topic 收到该消息注意事项:当使用 Token 访问重试/死信队列时,需要为消费者所使用角色赋予生产消息权限。
2026-01-06 11:36:43
650
原创 智汇云KV数据库ZestKV详解
在 ZestKV 中,每个 Region 对应一个 RocksDB-Cloud 实例,每一个 RocksDB-Cloud 实例产生的数据对应一个共同的 S3 文件名前缀,Region 的分裂即 RocksDB-Cloud 实例的分裂。分裂开始前,计算节点获取 Region [a-z] 实例的元信息,所有sst文件的层级关系,以及每个文件的smallestkey与largestkey,根据子 Region 范围确定文件归属,之后调用 RocksDB-Cloud 的 ingest 接口将文件注入。
2026-01-05 17:06:11
1030
原创 高效协作新利器:AI智能提取API文档+标准化
在研发效率成为核心竞争力的当下,APICLOUD AI 智能提取 API 文档功能以 AI 技术重构 API 文档处理流程,打破了传统模式的低效壁垒,实现了 “文档生成 - 接口调试 - Mock 服务 - 团队协作” 的全链路闭环。无论是减少重复劳动、缩短研发周期,还是打破协作壁垒、提升团队协同效率,该功能都为企业提供了切实可行的解决方案,助力企业在数字化转型中抢占先机。
2026-01-04 11:27:03
591
原创 360 HBox算力调度平台万卡规模高效调度方案深度解析
HBox 算力调度平台构建了一套面向万卡规模 AI 集群的全链路调度体系,本文介绍了 Hbox 的大部分算力调度能力:三池模型保障 SLA优先级抢占保障关键生产业务网络拓扑与 NUMA 双感知MIG + vGPU 虚拟化融合GPU与CPU 灵活配比调度……通过上述能力的协同运作,HBox 算力调度平台能够在复杂、多变的 AI 负载环境中,实现资源利用率、业务稳定性与调度公平性之间的平衡,为上层训练与推理业务提供稳定、高效的算力支撑。
2025-12-30 15:31:22
734
原创 存储压缩:不是“挤水分”,而是让数据“轻装上阵
回到最开始的问题:为什么我们现在的数据越来越“占地方”?除了数据量本身的爆炸式增长,更因为我们习惯了存储“原始数据”——就像刚买回来的食材,带着泥土和水分,体积自然大;而压缩就是给数据“做预处理”,去掉冗余的“泥土和水分”,让数据以更高效的形态存在。最后想说,存储压缩从来不是什么高深的黑科技,而是一种“精打细算”的工程思维。它告诉我们:数据的价值不在于“体积大小”,而在于“有效信息的密度”。
2025-12-26 15:42:48
724
原创 云舟观测报表管理功能:从业务到智能运维
观测报表管理功能是企业精细化运维的核心支撑,在多运维场景中发挥重要作用。当前仍面临数据质量、模板适配、灵活性、分析深度等问题,需通过针对性方案逐步解决。未来,随着AI技术的深度融合与垂直场景的持续拓展,观测告警巡检报表将不断释放数据价值,推动运维工作从“被动响应”向“主动预测”转型,助力企业实现运维数字化转型,护航业务高质量发展。关于云舟观测。
2025-12-26 15:41:12
664
原创 大模型开发平台TLM数据合成介绍
大模型数据合成(Data Synthesis for Large Models)是指通过人工生成或自动化手段构造用于训练、评估或增强大型人工智能模型(尤其是大语言模型,LLM)的数据集的过程。随着大模型对高质量、大规模训练数据需求的不断增长,真实世界数据在数量、多样性、隐私保护和成本等方面面临诸多挑战,因此数据合成技术逐渐成为解决这些问题的重要手段。一、为什么需要数据合成?1.数据稀缺性某些特定领域(如医疗、法律、低资源语言)缺乏足够的标注数据,难以支撑大模型的有效训练。2.隐私与合规问题。
2025-12-22 14:14:32
702
原创 PikiwiDB(pika) 分布式集群架构解析
PikiwiDB(pika)3.5.X版本发布了分布式集群方案,基于codis+PikiwiDB(pika)-server实现,已经在360内部搜索团队线上使用,稳定性和性能都非常优秀。本文主要介绍分布式集群的架构和部署方案。
2025-12-17 15:17:06
835
原创 HULK云数据库:TiDB集群多机房高可用
TiDB作为一款分布式、金融级高可用数据库,数据采用多副本存储,数据副本通过 Multi-Raft 协议同步事务日志,多数派写入成功事务才能提交,确保数据强一致性且少数副本发生故障时不影响数据的可用性。还可以按需配置副本地理位置、副本数量等策略,满足不同容灾级别的要求。目前HULK TiDB存在两种型态的集群高可用,一种是基于上述理论的单集群同域多机房高可用,一种是基于DTS同步工具的跨集群机房高可用。
2025-12-12 11:00:00
929
原创 声纹融合服务(Voiceprint Fusion Service)
以下为声纹融合服务提供的全部接口,支持声纹库创建、管理、特征提取、1:1 / 1:N 比对等完整流程。欢迎合作伙伴通过标准 API 接入,共同完善服务能力,拓展声纹融合服务在更多场景的应用价值。,融合科大讯飞、腾讯云及自研声纹模型,提供更稳、更准、更通用的声纹识别能力。随着金融风控、智能安防、数字政务、在线教育、车载系统等应用场景不断增长,:音频与声纹库比对,返回 TopN 匹配结果。:音频数据与库中特征比对,验证用户身份。:上传音频并抽取特征,存入指定声纹库。:创建新的声纹库,用于存储声纹特征。
2025-12-10 10:38:51
1015
原创 Milvus多租户的设计和实现
多租户架构是一种软件架构,其中多个客户(租户)共享同一个应用实例和基础设施,同时维护数据隔离。在这种架构中,单个软件实例为多个租户服务,通过各种隔离机制将每个租户的数据与其他租户分开。可以把多租户理解为:一台冰箱里放多个人的食材,但彼此不会串味,也不会互相把对方的冷冻室塞满。Milvus的多租户机制为向量数据库带来了真正意义上的“云原生隔离能力",通过数据结构分层+资源组的灵活组合,业务可以在同一集群上实现从轻量级租户到业务线隔离的多种形态,从而确保隐私、合规性,并在共享基础设施中优化了资源的分配。
2025-12-09 10:00:00
914
原创 大模型平台中模型蒸馏功能介绍
大模型蒸馏(Knowledge Distillation, KD)的核心原理是将大型、高性能的“教师模型”(Teacher Model)所学到的知识迁移至结构更简单、计算成本更低的“学生模型”(Student Model)。其基本思想不仅限于学习真实标签(hard labels),而是利用教师模型在训练数据上输出的类别概率分布——即“软标签”(soft labels),这些软标签包含类别间的相对关系和不确定性信息,蕴含了更丰富的知识。
2025-12-03 11:27:25
434
原创 智汇云API市场:大模型流式语音识别
大模型流式语音识别API接口,基于业界先进的语音识别、自然语言理解等技术,广泛应用于智能客服、小说阅读、在线教育、会议纪要、音视频字幕等多个企业应用场景。大模型流式语音识别API接口基于目前的流式语音识别技术在智能生活中的需求和应用场景,提供了业界先进的解决方案,并对识别过程进行了适当的优化,使语音识别技术更广泛和高效的适应用户需求。请求,如果是从文件读取的音频数据,需要使用一个 ticker 模拟真实的语音输入场景,如果每次发送 100ms 的音频数据,那么 ticker 的周期为100ms,每一个。
2025-12-01 14:37:55
728
原创 云舟观测智能体系统技术架构解析
随着云原生技术、微服务架构和容器编排体系的普及,IT系统的复杂度持续攀升。传统运维观测手段难以应对高维度数据、复杂链路与快速迭代带来的挑战,诊断效率与交互体验均面临瓶颈。云舟观测智能体系统( GC Agent System)由此推出。系统以自然语言交互为入口,通过统一编排层与标准化工具体系,实现对观测数据的智能分析、故障辅助诊断与知识检索,为企业构建新一代的自动化运维能力。本文聚焦系统架构设计、核心模块原理与工程实现,为大家呈现一个完整可靠、可扩展、企业级的监控观测智能体系统技术蓝图。
2025-11-28 10:38:10
797
原创 SEO 设置全解析:让你的文档轻松被搜索引擎收录
SEO(Search Engine Optimization,搜索引擎优化)是通过对网站、内容、外链等维度进行合规性优化,提升网站在搜索引擎(如百度、谷歌、搜狗等)自然搜索结果中的排名,从而获取免费、精准的自然流量,最终实现品牌曝光、用户转化等目标的一系列策略和操作。核心关键点拆解:本质。
2025-11-27 11:27:25
599
原创 智汇云 TTS 融合引擎:一站式多源语音合成,让声音更智能
集成阿里云、字节跳动(精品长文本 + 大模型异步TTS)以及自研 TTS 引擎,实现智能调度、稳定输出。欢迎合作伙伴通过标准 API 接入,共同完善服务能力,拓展语音合成在更多场景的应用价值。在智能客服、内容创作、教育培训、媒体播报、政务解说等行业中,:同一文本可并行提交至多个 TTS 引擎,自动选择最佳结果。:精品长文本 + 大模型异步,支持超长文本、情感表达。:逗号断句优化,大模型接口支持情感表达和上下文理解。:高自然度 TTS,多音色支持,自定义发音人。:低延时基础语音生成,并发能力可扩展。
2025-11-26 11:26:22
966
原创 高性能分布式文件系统PoleFS 客户端缓存介绍
PoleFS是一款自主研发的高性能分布式文件系统,采用NVMe加速+S3分层的存储架构,支持AI训练、大模型等场景。系统提供FUSE、Kubernetes CSI等多种接入方式,并通过多级缓存优化性能:元数据缓存包括内核缓存和客户端内存缓存;数据缓存涵盖内存、磁盘及分布式缓存。采用Close-to-Open一致性模型,在保证基本一致性的同时允许性能优化,用户可根据业务需求灵活配置缓存策略。系统通过预读、预热等机制提升读缓存命中率,平衡性能与一致性需求。
2025-11-25 15:53:10
912
原创 AI观察 | DeepAgent:具有可扩展工具集的通用推理智能体
近日,一项名为DeepAgent的研究引发了AI社区的广泛关注。它展示了一种全新的AI智能体形态:不仅能自主思考、动态发现并调用工具,还能在复杂的长期任务中,像人类一样“整理记忆”,避免思路混乱。这究竟是如何实现的?今天,我们就来一起拆解DeepAgent的核心技术,看看它是如何让AI变得更“聪明”的。一、传统智能体的瓶颈当前,大多数AI智能体遵循着预设的固定流程。比如,先规划、再搜索、后执行,就像一份不能变通的“标准作业程序”。缺乏自主性:无法在任务中动态发现新工具。难以处理长任务。
2025-11-20 16:27:43
757
原创 强化学习中GRPO、PPO的介绍
模型微调可以提供全量更新、LoRA、DPO、KTO、GRPO、PPO等训练方式,开发者可以选择适合自己任务场景的训练模式并进行训练,从而实现理想的模型效果。用户需注意,DPO/KTO的数据与其它微调方式有差异,用户在选择DPO/KTO训练方式的时候,需要提前准备好相应的数据。强化学习(Reinforcement Learning, RL)是一种让智能体通过与环境交互学习最优决策策略的机器学习范式。其核心思想是:智能体在环境中执行动作,通过接收奖励信号(正/负反馈)调整行为,最终学会最大化累积奖励的策略。
2025-11-14 10:40:11
852
原创 Kafka 消费积压影响写入?试试 Pulsar
Pulsar 中 topic 消费积压不会导致写超时,Pulsar 读写磁盘分开,写数据使用WAL磁盘,顺序写,WAL的数据会在内存中赞批刷到Ledger磁盘,数据消费时,如果没命中缓存,从Ledger磁盘读取,因此实现了读写IO隔离,互不影响。案例1: 金融某业务团队之前使用MQ,吞吐是 25MB/s,在 Kafka 中,内结价10385/月,切换到Pulsar后,当前内结价228/月,成本降低约45倍。Pulsar 支持最全的消息队列 API,支持复杂业务场景。
2025-11-13 17:01:57
759
原创 容器云质量加固方案
器云平台作为支撑业务创新和快速发展的关键基础设施,其稳定性和可靠性对于整个集团的业务连续性至关重要。面对日益增长的业务需求和不断变化的技术环境,对容器云平台的质量加固工作提出了更高的要求。在本方案中,我们详细分析了当前平台面临的挑战,并提出了一系列针对性的质量提升措施。通过降低故障频次、缩短故障恢复时间、提高服务可用性等方向的努力,我们旨在构建一个更加健壮、高效和可靠的容器云平台。这些措施不仅能够提升平台的稳定性,还能增强我们对未知风险的应对能力,从而为集团的业务发展提供坚实的技术支撑。
2025-11-12 10:25:23
975
原创 为云原生加速:深入解析PoleFS分布式缓存系统BlobCache
当用户创建缓存大小为20GB(写缓存:10GB,读缓存:10GB)时,弹性前缓存占用逻辑空间40GB(写3副本+读1副本),长时间没流量情况下,弹性后缓存占用逻辑空间最小可缩小至6GB(读缓存数据全部淘汰情况下),此时集群超额创建缓存比例可达6.7倍。当用户申请缓存后超过一定时间(默认:1h)未使用(即没有读、写、删流量),底层则会回收部分分配的逻辑存储空间,只保留最低可提供服务的存储空间(即每个vid写缓存只保留双buf所需存储空间,读缓存则按实际占用存储空间计算),以便集群创建更多的缓存。
2025-11-06 17:19:24
741
原创 以APICLOUD为数据构建企业级知识库系统
本文详细阐述了基于APICLOUD分享链接数据构建企业级知识库系统的技术实现路径。通过深入分析APICLOUD平台的数据特征,设计了一套完整的解决方案,涵盖了从数据采集、处理、存储到检索的全链路流程。系统的核心创新点包括:创新点介绍基于语义感知的动态文本分块算法通过结合文本 token 数量与语义密度动态调整分块大小,保证语义完整性与检索效率平衡。多阶段混合检索优化策略采用“向量检索 + 语义重排序 + 精排生成”三阶段策略,实现更高精度的知识召回与问答生成。支持海量数据的流式处理架构。
2025-10-31 10:49:18
658
原创 奇麟云数仓DataAgent,告别“数据加班“!
通常情况下,在做数据分析时按照不同的分析主题使用到的库表会是几张表或者几十张表,因此奇麟数仓DataAgent在使用前需要先基于有权限的库表根据数据分析主题构建一个数据主题,后续的数据分析都将在该数据主题中进行,这样做达到了用户+数据主题的数据权限隔离,该数据主题下的元数据、主题领域知识等向量化存储也是隔离的, 不会相互干扰。系统通过会话窗口级的长期记忆,实现错误恢复、连续对话,保持多轮对话的上下文连续性,支持对前面查询结果的引用和追问,提升交互体验。,老板问:"上周华东区销量最高的产品是什么?
2025-10-27 17:00:25
664
原创 从0到1理解智能体模式
将任务分解为线性依赖的步骤,前一步的输出作为后一步的输入,形成 “链式传递”。适用于 “步骤顺序固定、后步依赖前步” 的场景。基于 Ollama 实现 “先总结英文文本,再将总结翻译成中文” 的流程。# 1. 初始化Ollama配置(确保本地Ollama服务已启动:ollama serve)"""链式工作流:先总结文本,再翻译总结"""# 步骤1:总结英文文本summary_prompt = f"""请用1句话总结以下文本:要求:简洁准确,保留核心信息。"""
2025-10-24 14:55:14
1037
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅