数据与算法架构提升之路-CSDN博客

原创 2025：把“大模型”写进“数据闭环”——从自动驾驶到具身机器人，我如何用数据与算法做可落地的智能系统

2025年AI领域最显著的变化是从单一模型向可持续迭代的闭环系统转变。本文系统梳理了"数据→模型→行动→数据"的完整闭环链路，重点分析了四大关键层：数据底座（可追溯/可增量/可观测）、模型侧（本地推理可靠性）、自动驾驶（数据再生产）、具身智能（VLA可训练性）。作者通过实践总结出可落地的工程准则，包括数据湖布局策略、量化部署模板、Occupancy自动标注方案等，并将读者互动转化为闭环系统的需求输入端。文章强调真正的智能价值在于系统化的稳定生产能力，而非孤立模型效果。

2025-12-29 15:53:46 2247 1

原创突破认知边界：大模型研究者思维工具箱

为什么顶尖AI研究者总能突破常规边界？，他们的秘密在于：在其他人停止思考的地方继续深入探索。他们不满足于表面的答案，而是尝试从新的角度理解问题，找到切实可行的方法。

2025-04-23 20:22:56 473 1

原创架构师的六大生存法则与价值创造

架构师在软件架构设计中需遵循六大生存法则，确保方案与企业目标一致，尊重人性，最大化商业价值，考虑技术生命周期，注入外部适应性，并在文化环境中生存。这些法则帮助架构师在资源限制下，通过技术洞察和设计，实现商业模式的创新和效率提升，同时要求架构师具备良知和勇气，以全局和长期视角推动架构成功，为公司创造持续的商业价值。

2024-04-26 22:27:32 1616 1

原创《精力管理》阅读笔记

精力就是做事情的能力。包括体能、情感、思维、意志四个方面

2023-01-19 17:30:19 2297 2

原创论大模型应用架构（RAG/Agent）的设计与应用——以自动驾驶数据闭环平台为例

本文介绍了基于RAG和Agent技术构建的新一代自动驾驶数据闭环平台。该平台通过多模态向量数据库实现自然语言检索PB级驾驶数据，利用智能体集群自动化完成数据清洗、标注和仿真场景生成。关键技术包括CLIP+VectorDB+LLM检索架构、基于ReAct范式的标注流水线以及仿真场景生成Agent。系统显著提升了CornerCase挖掘效率（500%提升）和自动标注准确率（达95%），大幅降低了人工成本。架构创新点在于将RAG作为"场景知识库"，Agent作为"智能流水线&quot

2026-03-07 16:48:48 746 1

原创论大数据 Kappa 架构的设计与应用

本文介绍了基于Flink+Kafka的Kappa架构在新能源车企自动驾驶云控平台中的应用实践。针对原有Lambda架构存在的开发维护成本高、数据不一致等问题，项目采用Kappa架构实现流批一体化，通过FlinkSQL统一计算逻辑、Kafka分层存储构建无限数据流，并利用数据重放机制实现历史数据回溯。该方案使平台代码量减少50%，数据处理延迟降至秒级，有效解决了数据一致性问题，为实时性要求高且逻辑迭代频繁的场景提供了优化方案。

2026-03-05 13:52:58 601 1

原创论云原生架构下的可靠性设计——以自动驾驶云控数据平台为例

本文以某新能源车企自动驾驶云平台重构项目为例，阐述了云原生架构下的可靠性设计方案。针对50万辆在线车辆并发连接、数据丢失及任务积压等问题，项目采用Kubernetes云原生架构，通过三层设计实现系统高可靠：基础设施层利用Kubernetes自愈能力和KEDA事件驱动弹性伸缩应对高并发；应用层通过Sentinel实现核心链路熔断降级；验证层采用ChaosMesh进行混沌测试。最终平台日均处理10PB数据，核心服务可用性达99.99%，成功支撑大规模OTA升级。文章强调在自动驾驶领域需秉持"面向失败设

2026-03-05 13:32:35 462

原创论服务网格（Service Mesh）的应用

【摘要】本文以某造车新势力"分布式自动驾驶数据闭环平台"架构重构项目为例，阐述了服务网格技术的应用实践。针对原SpringCloud架构在多语言治理、框架升级和安全管控方面的痛点，项目团队引入Istio服务网格实现治理逻辑与业务解耦。通过Sidecar代理模式构建了非侵入式流量治理、全链路可观测性和mTLS零信任安全三大核心能力，并采用三阶段平滑迁移策略确保系统稳定性。实施过程中解决了Sidecar资源消耗和私有协议支持等关键挑战，最终使系统故障定位时间缩短60%，跨语言服务接入效率提升

2026-03-03 14:33:32 1179 2

原创论分布式缓存技术在车联网数据平台中的应用

【摘要】本文针对某车企新一代车联网平台面临的高并发挑战，提出基于分布式缓存的优化方案。面对日均超10万写入TPS和50万查询QPS的压力，系统采用"本地缓存(Caffeine)+分布式缓存(RedisCluster)"的多级架构，通过Redisson分布式锁解决缓存击穿，利用Canal+MQ实现数据库与缓存的最终一致性。该方案使核心接口响应时间降至10ms内，数据库负载降低70%，有效支撑了业务增长。文章重点阐述了多级缓存策略、高可用设计及数据一致性保障机制，为同类系统架构提供参考。

2026-03-03 11:13:40 868

原创论自动化测试技术在大型仿真平台中的应用

摘要：本文介绍了一套面向自动驾驶仿真测试平台的分层自动化测试体系。针对微服务架构下接口数量激增、UI频繁变更等痛点，设计了接口层（采用Python+Pytest+Allure实现数据驱动测试）、UI层（基于POM模式与无头浏览器集群）和AI增强层（实现脚本自愈与智能断言）的三维解决方案。通过Trace-ID全链路追踪、AI视觉元素定位等创新技术，将回归测试时间从3人天缩短至2小时，自动化覆盖率达92%。实践表明，该体系有效解决了传统测试在微服务场景下的效率瓶颈，为自动驾驶系统的高质量交付提供了保障。

2026-02-28 20:20:19 875

原创论AIOps（智能运维）在大型分布式系统中的应用

【摘要】2024年，作者作为核心架构师主导了某大型分布式服务平台的AIOps智能化改造。面对日均千万级请求和PB级数据处理压力，传统运维手段已无法应对告警风暴、故障定位困难等挑战。项目通过构建统一观测数据湖，引入时间序列异常检测、知识图谱根因分析等AI算法，实现了智能告警降噪、精准异常检测和快速故障定位。改造后系统告警准确率提升80%，平均故障恢复时间缩短30%，有效保障了99.99%的高可用性。本文详细阐述了AIOps的三层架构设计，重点分析了无监督学习异常检测、告警聚类关联分析等关键技术应用，为大规模分

2026-02-28 19:57:01 532

原创论系统安全架构设计及其应用（基于AI大模型项目）

摘要：本文分享了某大型科技公司"企业级AIGC能力中台"的安全架构设计经验。作为系统架构师，我主导设计了基于零信任理念的安全体系，重点解决API密钥泄露、数据越权访问等核心问题。针对传统静态APIKey管理混乱问题，采用OAuth2.0动态令牌机制；针对RAG场景的数据越权，创新性地将权限控制下沉到向量检索阶段，通过元数据注入和预计算过滤实现细粒度控制。项目最终建成日均2000万次调用的安全中台，为AI时代的企业级应用安全提供了实践参考。

2026-02-05 20:38:38 792

原创论湖仓一体架构及其应用

我所在的半导体企业随着产能扩张，数据管理面临严峻挑战。作为架构师，我经过调研发现，原有的烟囱式架构存在三大痛点：一是数据异构严重，MES的结构化数据、FDC的毫秒级时序数据及量测设备的半结构化文件分散在不同系统；因此，我决定采用“湖仓一体（Lakehouse）”架构，旨在构建一个既拥有数据湖的灵活性与低成本，又具备数据仓库的管理能力与高性能的新一代数据平台。同时，配置脏数据收集器（Dirty Data Collector），将清洗失败的数据分流至异常区，确保进入“湖仓”的数据必须符合开放标准格式的要求。

2026-02-03 21:19:29 773

原创论边云协同架构在自动驾驶系统中的应用

本文介绍了2024年参与的L4级自动驾驶测试平台研发项目，针对海量数据处理、实时决策和模型迭代等挑战，设计了一套基于KubeEdge的边云协同架构。该架构通过资源协同实现离线自治能力，数据协同采用价值驱动传输机制，智能协同构建云端训练-边缘推理闭环，应用管理协同实现容器化治理。实施效果显示，系统节省了95%带宽成本，模型迭代周期缩短至3天，支持50辆测试车累计行驶10万公里。文章还提供了机考论文写作要点，强调技术术语准确性、问题-解决闭环逻辑和量化数据支撑的重要性。

2026-02-03 19:15:31 1188

原创系统架构师考试必看：11个协议端口号形象记忆法，看完再也忘不掉（附记忆宫殿地图）

摘要：本文介绍了一种基于记忆宫殿的形象编码系统，帮助快速记忆网络协议端口号。通过将数字转换为生动图像（如22=天鹅、443=帆船+手铐），构建11个协议记忆场景：HTTP80（雪人上网）、SSH22（双天鹅隧道）、POP3110（筷子夹邮件）等。采用5分钟博物馆参观路线复习法，配合0-9数字形象编码表（如6=高尔夫球杆），将枯燥数字转化为夸张画面。该方法利用人脑对图像的超强记忆能力，可在一周内永久记住核心协议端口，特别适合网络工程师考试备考。（149字）

2026-01-27 19:02:47 713

原创论多源数据集成技术在半导体良率分析平台中的应用

本文针对半导体制造中的数据孤岛问题，设计了混合多源数据集成架构：采用DataX中间件实现MES等异构业务数据低侵入同步，通过自定义类型映射与流控保障数据质量；构建以IoTDB时序数据库为核心、Flink+Spark为引擎的流批一体数仓，解决高频传感器数据的高吞吐写入与海量历史存储矛盾；引入Presto联邦查询引擎，通过广播Join、计算下推与资源隔离实现跨源秒级关联。平台纳管PB级生产数据，将良率异常定位周期从3天缩短至2小时，助力先进制程良率爬坡。

2026-01-24 14:18:16 744

原创自动驾驶的“加塞”难题：为什么AI学不会“老司机”的丝滑？

自动驾驶处理加塞难题面临三大核心挑战：数据质量、模型训练和架构瓶颈。人工采集的"兔子车"数据缺乏真实博弈场景，导致模型误判；人类"老司机"驾驶数据存在非线性操作，使模型陷入拟合困境；传统两段式架构丢失关键信息（如轮胎角度），造成预判困难。解决方案包括：优先采用真实驾驶数据、优化数据阶段配比（侧重压线瞬间）、向端到端架构演进。这些改进旨在让AI系统更接近人类驾驶直觉，实现安全又自然的加塞应对。

2026-01-24 13:44:25 870

原创论微服务架构在电商交易系统中的设计与应用

摘要：本文详细介绍了2024年某大型电商平台重构项目，针对原有单体架构在高并发场景下的性能瓶颈，采用基于SpringCloudAlibaba的微服务架构解决方案。系统拆分为用户、商品、订单、支付和物流五大核心服务，通过Redis缓存、Redisson分布式锁和RocketMQ异步消息等技术实现高并发处理。重点阐述了商品查询的多级缓存策略、下单流程的分布式锁机制以及支付回调的异步解耦方案，并分析了库存超卖和服务雪崩问题的解决思路。项目最终实现5万TPS并发处理能力，系统可用性达99.99%，为大型电商平台架构

2026-01-23 15:06:00 730 2

原创 Seata 全景拆解：AT、TCC、Saga 该怎么选？告别“一把梭”的架构误区

Seata分布式事务模式深度解析摘要： Seata作为阿里开源的分布式事务解决方案，提供AT、TCC、Saga和XA四种模式。本文从架构师视角对比分析三种主流模式：AT模式通过全局锁实现自动事务管理，适合简单CRUD但存在性能瓶颈；TCC模式通过资源预留保证强一致性，适合核心资金链路但开发复杂；Saga模式采用补偿机制处理长事务，适合跨系统业务但缺乏隔离性。文章深入剖析各模式原理、适用场景及实战权衡，指出AT模式适合短平快业务，TCC适用于资金敏感场景，Saga则擅长处理长链路事务。最后提出决策树选型指南

2026-01-23 15:04:44 958 1

原创系统架构设计师常见高频考点总结之数据库

本文摘要：文章系统介绍了数据库系统设计中的三个核心问题。首先阐述了高可用数据库架构的实现方法，包括冗余设计、主从复制和缓存策略，重点讲解了Cache-Aside模式的读写流程。其次分析了数据库设计中的命名冲突、属性冲突和结构冲突问题。最后通过实例详细解析了函数依赖关系和无损连接分解的判断方法，包括候选键确定、Chase算法验证等。全文提供了数据库系统设计的标准化解决方案框架，适用于数据库架构设计和相关考试场景。

2026-01-23 11:12:19 765 2

原创系统架构设计师常见高频考点总结之操作嵌入式系统

本文摘要：实时操作系统(RTOS)的核心特征是确定性和高可靠性，其性能指标包括上下文切换时间、中断延迟等。RTOS采用抢占式调度，需解决优先级反转问题，常用优先级继承和天花板方法。中断管理涉及中断向量表和ISR流程，I/O控制包括查询、中断和DMA三种方式。存储管理涵盖Cache、MMU和Flash技术，NORFlash适合代码存储，NANDFlash适合数据存储。这些知识点对理解RTOS至关重要。

2026-01-21 20:38:06 615 1

原创实战：手搓一个“BEV 级”自动驾驶训练加速平台 —— 当 RTX 4090 遇上多模态数据

自动驾驶算法训练面临多模态数据处理瓶颈：传统方法在图像和LiDAR点云的异构数据加载、预处理及融合环节效率低下。本文提出平台级优化方案：1）采用NIXL实现SSD到GPU的零拷贝直传，IO等待降低85%；2）利用CUDA/Triton重写核心算子，点云体素化耗时从30ms降至2ms；3）开发FlashBEV融合算子，相比PyTorch实现提速40倍且显存占用减少90%。最终在消费级GPU上实现专业级训练吞吐，让开发者专注模型创新而非底层优化。

2026-01-19 21:26:58 998

原创系统架构设计师常见高频考点总结之软件架构设计

本文系统介绍了软件架构设计的关键知识点。首先阐述了分层架构、管道-过滤器、微内核和微服务四种主流架构风格的定义、优缺点及适用场景。其次强调架构设计的本质是质量属性权衡，并指出可扩展性设计原则。重点分析了单体架构痛点及向微服务演进的策略，包括业务拆分、数据库优化等技术手段。最后概述了系统安全性设计的纵深防御原则和常用图表类型。文章建议理解架构设计的权衡本质，结合实际项目加深认知，避免绝对化思维。

2026-01-16 23:19:08 1034 1

原创 TeleTron 源码揭秘：如何用适配器模式“无缝魔改” Megatron-Core？

本文剖析了TeleTron项目如何通过非侵入式适配器模式优化Megatron-Core框架。核心创新包括：1）运行时动态替换DDP实现，改进梯度同步精度和通信效率；2）扩展上下文并行支持，巧妙绕过原生限制；3）自动化模型与优化器配置流程。该方案通过一个megatron_adaptor.py文件实现，既保持框架兼容性又增强功能，展示了Python动态特性与设计模式的精妙结合，为LLM训练框架定制提供了优雅范例。

2026-01-16 13:27:30 678

原创拒绝人工堆料！深度拆解某头部智驾团队的“95%自动化标注”黑科技

自动驾驶技术竞争已转向云端数据闭环系统，工业级"真值工厂"成为决胜关键。最新方案通过95%自动化率的Autolabel系统，整合RT-Detr、Sparse4D、NeRF和GTSAM等前沿技术，实现全要素重建与分层真值生成。系统采用Transformer架构和稀疏感知算法处理预标注，利用GTSAM因子图优化进行轨迹平滑，并通过交叉验证机制确保标签准确性。当前挑战包括算力消耗、异形障碍物识别和多模态冲突等问题，但该方案已展现出从几何方法向AI生成技术的范式转变，成为自动驾驶迈向L3/L4的

2026-01-16 00:06:48 1435

原创百万级 Frame 吞吐背后：自动驾驶数据平台如何支撑 VLA 端到端大模型训练

摘要：本文介绍了一种基于Kubernetes+Argo的云原生自动驾驶数据平台架构，针对VLA大模型训练中的数据处理难题提出了创新解决方案。通过"索引-实体分离"技术实现视觉数据高效存储（MKV+Parquet），采用标准化ETL流程处理激光雷达数据（PCAP转PCD），并开发了"胶水代码生成"和"S3热加载"机制，使算法工程师能像本地开发一样使用分布式计算资源。该架构显著降低了90%的存储成本，实现了秒级代码热更新，为自动驾驶大模型训练提供了高效

2026-01-11 00:38:34 187

原创系统架构设计师常见高频考点总结之软件工程

本文总结了软件工程与软件过程模型的核心考点，主要包括：1. 常用软件过程模型（瀑布、V模型、原型等）的特点、适用场景及局限性；2. 4+1视图模型的逻辑、开发、过程、物理视图及场景视图的关键特征；3. 软件测试阶段的划分及Alpha/Beta测试的区别；4. 构件的三大特性（自包含、不可拆分、黑盒）；5. PERT三点估算法的计算步骤和关键路径分析方法。文章提供了各知识点的速记技巧和应试策略，如通过关键词快速判断适用模型、视图类型的记忆口诀等，帮助考生高效掌握核心内容。

2026-01-08 09:34:45 1346

原创系统架构设计师常见高频考点总结之操作系统

本文摘要：本文系统梳理了操作系统核心考点，包括：1）进程同步中的前趋图与PV操作（前V后P原则）；2）分页存储管理的地址转换方法（页号=逻辑地址/页面大小，偏移=取余）；3）流水线时间计算（吞吐率公式及加速比）；4）RAID容量计算（短板效应与校验扣除规则）；5）磁盘I/O性能优化（非优化/优化分布处理）；6）CRC校验码计算（模二除法步骤）；7）文件索引节点法（直接/间接索引范围划分）。全文通过典型例题解析，提炼各知识点的计算规律和解题技巧。

2026-01-08 09:33:57 981

原创系统架构设计师（软考高级）设计模式备考指南

【摘要】本文系统梳理了架构师考试中设计模式的备考要点。核心考察点在于"权衡"和"质量属性"，而非单纯记忆代码。文章将23种设计模式分为必考(T0)、常考(T1)和了解(T2)三类，重点分析行为型、结构型和创建型模式的典型应用场景。针对不同考试科目提供具体策略：上午题采用"关键词秒杀法"，案例分析侧重UML识别与填空，论文写作建议套用电商项目模板。同时强调需区分架构模式与设计模式，注意状态模式与策略模式的区别。最后给出备考行动计划，包括模式分类记忆、

2026-01-04 21:36:42 1018

原创硬核干货 | 自动驾驶“天眼”揭秘：万字详解 LiDAR 传统感知算法全流程

自动驾驶LiDAR感知算法解析：从原始点云到目标识别的全流程拆解。文章详细介绍了激光雷达数据处理的关键步骤：1)点云预处理（ROI分割和体素降采样）降低计算量；2)Patchwork算法实现复杂路面的精准地面分割；3)多种聚类方法（欧式聚类、DBSCAN、图像聚类）识别障碍物；4)目标拟合技术（凸包算法、旋转卡尺、L-Shape）生成精准边界框。这套传统算法流程具有可解释性强、资源占用低的优势，仍是自动驾驶系统的重要基础。

2026-01-03 01:13:04 2167

原创 DeepSeek 内部核武曝光：mHC 架构如何重新定义大模型“高速公路”？（附算力受限团队生存指南）

摘要：DeepSeek最新论文《mHC: Manifold-Constrained Hyper-Connections》提出突破性架构创新，通过流形约束超连接技术解决大模型深层训练中的梯度爆炸和显存瓶颈问题。该技术将残差映射矩阵约束为双随机矩阵，实现信号能量守恒，同时通过全栈自研的编译器优化和内核融合大幅降低显存I/O压力。论文揭示了DeepSeek从优化节点转向优化连接的架构哲学转变，为资源受限团队提供了四大实战策略：1）用宽残差流替代堆叠层数；2）引入双随机约束提升训练稳定性；3）利用Triton实现内

2026-01-02 22:38:40 1193

原创深度解析 TeleTron：融合 CUDA 内核如何极致优化 HunyuanVideo 训练性能

本文深入分析了TeleTron框架在DiT模型训练中的优化技术，重点介绍了融合CUDA内核的实现路径。通过环境变量控制融合内核开关，将AdaLayerNorm和RMSNorm的多次显存读写合并为单一高效内核。关键技术包括：1）Welford算法确保数值稳定性；2）向量化访存提升带宽利用率；3）Warp级归约优化线程通信；4）针对特定维度（如3072/128）的特化实现。这些优化手段有效突破了显存带宽瓶颈，显著提升了训练吞吐量，为大规模Transformer模型训练提供了高效解决方案。

2026-01-02 19:27:50 695

原创系统架构设计师常见高频考点总结之计算机网络

本文系统梳理了网络技术核心知识点：1. 网络分层架构类比高速公路系统，核心层-汇聚层-接入层各司其职；2. 重点解析OSI模型各层设备特性，区分路由器/交换机/网关功能差异；3. 详解SAN/NAS存储技术特点及适用场景；4. 归纳网络规划原则与服务器部署策略；5. 总结TCP/IP协议族、IPv6特征及常见网络攻击原理；6. 梳理安全协议、负载均衡等进阶内容。全文采用"概念解析+考点提炼"的框架，通过技术对比和典型场景分析，为网络架构学习提供系统化认知框架。

2026-01-01 14:12:02 1288

原创软考架构师必读：别再死磕物理层！一文掌握 5G 架构设计的“上帝视角”

摘要：本文针对系统架构设计师考试中的5G考点，从架构师视角解析5G技术的应用要点。重点阐述了5G三大场景特性（eMBB、uRLLC、mMTC）及其适用领域，提出了案例分析的两种架构设计模式（5G+MEC和网络切片），并提供了论文写作的万能背景模板。强调备考应聚焦5G与系统架构的关联性，而非通信技术细节，帮助考生高效掌握5G在软考中的核心考点和答题技巧。

2026-01-01 14:10:19 747

原创还在死磕 IPv6？背下这 5 句口诀，面试/考试横着走！

IPv6核心知识点速记 IPv6采用128位地址（16字节），使用冒号分隔的十六进制表示法，支持前导零省略和双冒号压缩。其无状态自动配置(SLAAC)通过EUI-64算法将MAC地址转为接口ID。协议改进包括：固定40字节报头、取消广播改用组播/任播、仅源主机分片、原生IPSec支持。过渡技术含双协议栈、隧道和NAT64翻译。关键口诀："128位长，冒号十六进制；双冒号一次，前导零可弃；自动配地址，后缀用MAC；报头四十字节，广播已绝迹；过渡用双栈，隧道穿隔壁"。典型考点涉及地址长度（1

2025-12-31 12:30:27 468

原创 DHCP (动态主机配置协议)软考系统架构师考点秒杀

摘要：DHCP是应用层UDP协议，通过DORA四步（Discover-Offer-Request-ACK）动态分配IP。服务端端口67，客户端68，分配内容包括IP、网关等。租约机制包含50%单播续约和87.5%广播续约两个关键时间点，客户端通过免费ARP检测IP冲突。除动态分配外，还支持自动分配和静态分配（MAC绑定）。考试重点包括端口号、DORA流程、Request广播原因及续约机制。

2025-12-31 10:38:14 923

原创自动驾驶的“脏活”：手撕激光雷达运动畸变与鬼影（附 Python/C++ 核心实现）

摘要：本文探讨自动驾驶领域激光雷达点云预处理的关键技术挑战。针对运动畸变问题，提出基于IMU数据的高效运动补偿方案，采用SLERP插值和SIMD指令集优化计算性能。同时分析多路径反射导致的鬼影现象，给出强度筛选、几何一致性和时序跟踪的三重过滤策略。文章强调在端到端大模型时代，传统预处理技术对数据质量保障的核心价值，并分享C++/Python工程实践中的性能优化技巧，为自动驾驶感知系统提供可靠的数据基础。

2025-12-29 19:48:31 1186

原创 Google 在不到 4 分钟内部署了 130,000 个 Kubernetes Pod（具体如何实现）

Google构建了全球最大Kubernetes集群，拥有13万个节点，能在3分40秒内部署13万个Pod，持续维持每秒1000个Pod的创建速度。这一突破性成就不仅展示了技术实力，更为AI基础设施发展提供了新蓝图。该集群采用智能缓存、基于Spanner的存储和Kueue调度系统，解决了大规模资源管理的核心挑战。对于AI训练、动画渲染等场景，快速调度能力可大幅降低闲置成本（10,000块H100 GPU每分钟闲置成本达500美元）。该创新将使各类企业受益，从小型初创公司到大型AI实验室，标志着Kubernet

2025-12-29 10:51:35 861 1

原创还在用数据库做排行榜？Redis ZSET 才是高并发“热销药品”排名的神器！

本文详解Redis ZSET（有序集合）实现实时热销榜单的技术原理与架构优势。针对医药电商等高并发场景下传统数据库"ORDER BY"性能崩溃的问题，ZSET提供了毫秒级TOP N查询能力。核心实现采用"双形态"动态切换策略：小规模数据：使用压缩列表（Listpack/Ziplist）极致节省内存大规模数据：自动升级为跳表（SkipList）+ 哈希表（Dict）复合结构，兼顾排序与精准查询

2025-12-29 00:31:33 1246 3

原创离线自动标注 Occupancy：别再把“墙后面”当成空气了（附 3D Ray Casting 源码）

自动驾驶占据栅格模型出现"穿墙"问题？问题可能出在真值数据上。本文提供了一套完整的离线自动标注方案，通过SLAM轨迹优化、动态物体剔除和光线投射技术，精准生成Free/Unknown/Occupied三态真值。关键点包括：1）利用多帧点云叠加获得稠密场景；2）采用3D Bresenham算法实现高效光线投射；3）严格区分未知区域，避免错误标注。文章还分享了Python实现代码和工程优化技巧，如稀疏存储和计算加速，帮助开发者构建高质量的Occupancy数据集，从根本上解决模型误判问题。

2025-12-26 19:23:53 1264 1

部署开源大模型的硬件配置全面指南

2024-12-21

人工智能大模型技术白皮书

2024-11-28

多模态大模型在视觉领域的全面调查

多模态大模型发展综述

2024-11-21

Kaggle生物信息学挑战：酶稳定性预测大赛

数据集和代码

2024-11-07

Flink CDC的前世今生-设计思想解读

2024-10-22

自动驾驶⻋辆环境感知：多传感器融合

bev技术研究

2024-06-23

单目视频的实时相干3D重建

2024-04-12

针对小尺寸自动驾驶汽车的轻量级语义slam解决方案

2024-04-11

【Kaggle比赛】DFL 德甲足球事件检测大赛（CV·目标检测-视频分类）

2024-04-06

线性回归与逻辑回归测试数据

2024-01-29

Spark面试攻略：全面准备与技巧指南.docx

Spark面试攻略：全面准备与技巧指南

2024-01-26

知识问答助理python代码

2024-01-06

一个在有序行和列的矩阵中选择第k小元素的O(n)时间复杂度算法

这篇文章是《Information Processing Letters》1985年第20卷第1期的一篇论文，标题为“Selection in X+Y and Matrices with Sorted Rows and Columns”，作者是A. Mirzaian和E. Arjomandi，来自加拿大约克大学计算机科学系。文章的主要内容是关于在有序矩阵中进行选择（selection）问题的研究。具体来说，文章提出了一个在有序行和列的矩阵中选择第k小元素的O(n)时间复杂度算法。这个问题在统计学和运筹学中有应用，并且与VLSI布局问题相关。

2024-01-01

数据中台的集群规划和搭建

2023-12-27

数据中台的集群规划和搭建

2023-12-27

数据中台的集群规划和搭建

2023-12-27

数据中台的集群规划和搭建

2023-12-27

用户画像学习资料链接地址

用户画像学习资料

2023-11-16

华为鸿蒙4谷歌鸿蒙GMS安装的安装包

华为鸿蒙4谷歌鸿蒙GMS安装的安装包 https://blog.csdn.net/lzhcoder/article/details/133976046

2023-10-23

大数据技术之Spark调优

2023-05-03

DolphinScheduler 与 Spark 在 Kubernetes 上的部署：一步步指南

与 Spark 在 Kubernetes 上的部署：一步步指南

2025-12-17

bitnami/zookeeper 3.6 docker镜像

dolphinscheduler Helm Chart (Charts/Zookeeper) 是基于 Bitnami 的标准编写的，而你官方原生的 zookeeper:3.6。这两者的目录结构、启动脚本、环境变量名完全不同，互不兼容！修改 Helm Chart 适配不同底层的镜像是一个非常复杂的过程，很容易出现权限不足、配置文件生成失败、集群无法互通等问题。

2025-12-17

Map-World：用“填空”与“路径积分”重构自动驾驶规划范式

2025-11-29

计算广告建设书籍打包版

算法与数据中台，计算广告，DSP,DMP

2025-11-23

RT-2：Google DeepMind的机器人革命-如何让AI从网页知识中学会操控现实世界

2025-11-23

字节具生机器人模型GR-3技术报告

2025-11-20

Seedream 4.0技术报告

2025-11-18

2025年ASR技术前沿：从端到端模型专利到AI语音就业机会，全方位解析自动语音识别的未来

2025-11-06

解锁亚马逊评论的秘密：基于语义嵌入与 t-SNE 可视化的深度分析

完整代码实现

2025-06-05

深度解析：Spark、Hive 与 Presto 的融合应用之道

Spark SQL 查询系统基于 Apache Spark 的分布式SQL查询引擎 - Local模式

2025-05-25

SuperSonic 为机器人制造企业数字化转型注入强劲动力

2025-05-07

Chain-of-Verification (CoVe)：让大模型“自我审校”的技术如何落地？

2025-03-19

扩散模型资源与最新研究大汇总：从图像生成到自动驾驶的前沿探索

2025-03-15

扩散模型在低级视觉任务中的应用：5个必看开源项目附代码

2025-03-14

KIMI K1.5：大规模强化学习在大语言模型中的应用与工程实践

2025-02-25

基于对抗学习的多级交互融合网络用于高光谱和LiDAR数据融合分类

这篇论文提出了一种新的多模态数据融合框架,通过多层次的特征交互和融合,有效提高了高光谱和LiDAR数据的分类性能。实验结果证明了该方法的先进性和有效性。

2025-02-17

基于李宏毅老师深度强化学习蘑菇书EasyRL

李宏毅老师的《深度强化学习》是强化学习领域经典的中文视频之一。李老师幽默风趣的上课风格让晦涩难懂的强化学习理论变得轻松易懂，他会通过很多有趣的例子来讲解强化学习理论。比如老师经常会用玩 Atari 游戏的例子来讲解强化学习算法。此外，为了教程的完整性，我们整理了周博磊老师的《强化学习纲要》、李科浇老师的《世界冠军带你从零实践强化学习》以及多个强化学习的经典资料作为补充。对于想入门强化学习又想看中文讲解的人来说绝对是非常推荐的。

2025-02-07

DeepSeek-R1-技术报告中文版-由deepseek翻译.pdf

2025-01-24

扩散模型如何在智能交通(自动驾驶、交通仿真、轨迹预测等)领域发挥作用

扩散模型是通过模拟扩散过程、逐渐添加和去除数据中的噪声来生成逼真样本的概率模型。这些模型在图像处理、语音合成和自然语言处理等领域因其生成高质量样本的能力而受到关注。随着扩散模型在各个领域的应用不断增加，现有的文献综述通常专注于计算机视觉或医学影像等特定领域，可能无法满足跨多个领域的广泛受众。因此本综述提供了对扩散模型的全面概述，包括其理论基础和算法创新。突出了其在媒体质量、真实性、合成、图像变换、医疗保健等多个领域的应用。通过整合当前的知识并识别新兴趋势，本综述旨在促进对扩散模型的更深入理解和更广泛的应用，并为各个学科的未来研究者和实践者提供指导。

2025-01-18

AI发展新态势:从技术突破到安全隐忧

2024-12-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人