- 博客(161)
- 资源 (1)
- 收藏
- 关注
原创 NVIDIA Omniverse NuRec
当你运行 NuRec 时,它会把真实世界数据转换为三维场景,并在。相关工作的开发者,通过 NuRec 的渲染已内置于 Omniverse,因此你可以直接使用。)的用户可以在应用中加载兼容场景,并通过 OmniNuRecVolumeAPI。文件后,你可以加载它,并使用 OmniNuRecVolumeAPI。的流程,NVIDIA 在 Hugging Face 上的。的 JSON 文件。地图,用于下游仿真任务(交通建模、场景编辑等)。模型会对渲染图像进行精修,以在重建与渲染过程中。,以便与仿真平台无缝集成。
2026-03-23 07:14:32
245
原创 IsaacSim: 用智能手机在 NVIDIA Isaac Sim 中重建场景
为机器人仿真构建逼真的三维环境往往费时费力。如今借助,你只需一部智能手机即可完成全流程。本文逐步说明:从用拍摄照片,到用重建三维场景,再到载入并放入机器人。若希望跳过重建(步骤 1–3),直接在中探索场景(步骤 4),请访问 Hugging Face 上的。
2026-03-22 14:08:27
351
原创 3DGS如何提升面向仿真的三维高斯重建质量
本文围绕Fixer与工作流,说明了如何从带伪影的重建结果出发,通过离线或在线方式提升三维高斯类渲染在仿真中的可用性与观感,尤其适用于自动驾驶等需要稳定、清晰多视角输出的场景。如需复现,请结合官方仓库、Docker 环境与 Hugging Face 上的模型与数据集说明进行操作。文章来自:https://developer.nvidia.com/blog/how-to-enhance-3d-gaussian-reconstruction-quality-for-simulation/
2026-03-22 12:15:40
324
原创 CARLA: 如何在 CARLA 中回放自动驾驶场景
对于自动驾驶(AV)开发,集成到开源 CARLA 自动驾驶模拟器中的 Omniverse NuRec 库提供了强大能力。这是一项实验性新功能,适用于 NVIDIA Physical AI Dataset 中已完成重建的示例场景。前向车载摄像头视角下,真实世界繁忙街道在仿真中的重建效果。:用于 CARLA 中 Omniverse NuRec 渲染流程的示例场景。
2026-03-20 10:38:03
352
原创 NUREC: 如何在交互式模拟中即时渲染真实世界场景
本文将介绍NVDA提供的一个工具包NVIDIA Omniverse NuRec和3DGUT,可以帮助人们从简单的传感器数据重建逼真的 3D 场景,并立即将其部署到NVIDIA Isaac Sim或CARLA 模拟器中。本文包括如何捕获真实世界的数据、训练重建模型,并将结果加载到 Isaac Sim 中。相关视频推荐:https://youtu.be/e3dfXj6ATA0神经重建技术能够实现机器人,从而。以下步骤将神经重建和渲染流程简化为一个适用于不同环境的通用方案。
2026-03-20 09:34:21
349
原创 真正的财务自由,不是你想的那样;你的资产,在全国排老几?
这种财富分配的“马太效应”在2025年愈发明显,主要原因在于高净值人群拥有更广泛的渠道进入股权投资和私募市场,而这些资产在AI浪潮驱动下的溢价远超劳动报酬的增长 6。对于20岁的毕业生,放弃对“稳定铁饭碗”的执念,拥抱“AI+资产所有权”的新模式,将是通往中产阶级与财富自由的必经之路。此外,欧洲央行(ECB)的消费者预期调查显示,18-34岁的欧洲青年对未来12个月的通胀预期(2.6%)低于年长群体,但由于失业预期在低收入群体中仍高达13.5%,这使得该年龄段的消费与投资决策趋于谨慎 16。
2026-03-02 04:43:31
546
原创 水下软体机器人(水母)的设计、制造概念
在这一阶段,还要把各种限制想清楚,比如**整机要接近中性浮力、防水要可靠、电路板和水泵要放在哪里、水泵怎么连到触手上、触手多长、伞直径多大、材料要多软或多硬(**通过不同 Shore 硬度的硅胶组合来调节),以及后面打算用什么加工工艺做出来——这就是“设计逻辑”:先从需求和环境出发,确定外形和运动方式,再反推材料、尺寸和加工方法。在水母机器人里,触手的内部还设计成有多个连通的小腔室和一条公共通道,灌模时这些细节都被“刻”在 3D 打印的模具里,所以硅胶固化后自然就具备了这些内部结构。
2026-02-28 04:17:12
506
原创 机器人仿真: 训练自己第一个平衡机器人Cartpole
用 Isaac Lab 做强化学习时,一个任务是怎么被「注册」的?配置里的奖励、终止、观测到底在哪生效?训练脚本又是怎么把环境和 PPO 串起来的?这篇博客顺着「从注册到训练」的一条线,把 Cartpole 项目里的代码是怎么 work 的讲清楚。当我们输入指令:该指令会执行训练 Cartpole 任务(Template-Cartpole-v0),同时调用 4096 个并行环境 做 PPO 训练背后大致是这几步:id:就是环境的名字。Gym 通过id定位环境。entry_point:一个字符串,像
2026-02-02 08:44:22
835
原创 论文随笔 回到过去,关于具身智能与人机交互的思考
小编之前有一篇文章有讨论到其作者开发设备让用户增强某些感知, 举个例子,你在剥橘子,其会增强你剥橘子的产生的声音(因为很小,正常听不到),通过这样的方式,让用户将更多注意力放在手头上的事,而不是一边剥橘子一边看电视,一边和人说话, 这样可以让用户将重心回归手头的活,专注于当下的细节。批注:从舞蹈从业者的角度思考身体的作用似乎是很好的切入点,因为舞蹈,包括武术等需要的是全身的协调,身体作为一个模型,去感知世界,其是如何联系的?CHI 2011 研讨会专刊导读。批注:强调身体感知的延伸。
2026-01-22 14:31:35
692
原创 机器人仿真: Isaac Lab 环境配置完整指南
本文详细记录了在Windows系统上配置Isaac Lab环境的完整流程。首先需满足Python 3.11、NVIDIA GPU等系统要求,然后通过启用Windows长路径支持、创建虚拟环境、安装Isaac Sim和PyTorch等步骤完成基础配置。重点解决了Windows长路径限制和Python版本兼容性等常见问题,最后通过验证脚本确认安装成功。该指南为机器人学习提供了完整的开发环境搭建方案,包含详细命令和问题解决方案。
2026-01-19 14:32:42
1083
原创 论文随笔 从“制造”到“生长”:当交互设备拥有了生物的灵魂
在数字化浪潮席卷全球的今天,我们的电子设备正陷入一种尴尬的悖论:它们在性能上登峰造极,却在生命周期上短促而廉价。为了追求标准化和规模化,我们制造了无数难以拆解、不可回收的“电子垃圾”。但在最近的 HCI(人机交互)顶级会议上,来自萨尔大学和巴黎理工学院的研究员上排左侧与中间(膝盖/关节处): 展示了贴合身体的电路(On-body circuits)。由于生物塑料具有很好的柔韧性和粘附性,它可以像膏药一样贴在关节处,并随着肢体运动而弯曲,保持导电性能。
2025-12-22 12:02:08
883
原创 论文随笔 聊聊感知智能用户界面的三大核心
感知智能 UI 的出现,标志着 XR 交互从“人适应机器”向量“机器适应人”的跨越。通过理解感官极限动态重组界面以及持续锁定意图,未来的 XR 设备将不再是遮挡我们视线的屏障,而是成为我们感知世界的一种延伸。正如 Hyunsung Cho 在论文中所言:科技的终极目标是无缝集成到人类经验中,支持而非淹没我们的自然能力。
2025-12-20 16:19:23
1013
原创 论文随笔 感官支架: 科技如何带我们重返现实?
感官支架”并非让你永远依赖设备,而是一种暂时的感知干预系统。它像是一副“感知放大镜”,通过调节感官体验来打破习惯化。核心:不只是教你“换个方式思考”(认知策略),而是让你直接“换个方式感知”(感知策略)。图 1:支持手动交互的正念设备这张图片展示了一个用于增强日常操作感知的可穿戴系统。其工作流程如下:声音采集:通过用户手腕上的麦克风,捕捉手动操作(如图片中正在捣碎东西)产生的细微声音。实时放大与回放:系统将这些声音实时放大,并通过耳机回传给用户。
2025-12-19 16:15:37
921
原创 普通LLM智能体与具身智能:从语言理解到自主行动
摘要:近年来,大语言模型(LLM)的发展推动了AI系统的演进,形成了两种主要形态:普通LLM智能体和具身智能(Agentic AI)。普通LLM智能体如智能客服系统,通过语言处理实现被动响应式交互,适合信息检索和辅助决策。而具身智能则具备自主规划、环境感知和学习能力,如小鹏汽车的智能驾驶系统,能够主动执行复杂任务并持续优化。具身智能被视为迈向通用人工智能(AGI)的关键,其目标理解、自主决策和环境适应能力为AI系统赋予了更接近人类智能的"能动性"。
2025-11-11 04:26:34
941
原创 Transformer前世今生——使用pytorch实现多头注意力(八)
在本教程中,我们将一步步用 PyTorch 实现:一个通用的Attention 类自注意力(Self-Attention)掩蔽自注意力(Masked Self-Attention)编码器-解码器注意力(Encoder-Decoder Attention)一个Multi-Head Attention 类→ 模拟 Transformer 中多个“头”同时计算注意力的机制。多头注意力让模型拥有多双“眼睛”,每个头专注不同的语义视角,最终融合成更全面的理解 ——
2025-11-07 02:56:49
1021
原创 Transformer前世今生——多头注意力(六)
多头注意力是 Transformer 模型中的核心机制之一。让模型从多个不同的角度同时理解句子中的词语关系。简单来说,不只用一个“注意力头(Head)”去分析词与词之间的关系,而是同时使用多个头,每个头关注不同的语义层面。👁️ 第一双眼睛看语法结构;👁️ 第二双眼睛看情绪和语气;👁️ 第三双眼睛看主语与宾语的关系。多个“头”同时工作,再把结果融合起来,就能更全面地理解语义。关键点含义多头注意力模型通过多个“头”同时从不同角度理解句子每个头独立学习每个头有独立的 Q、K、V 权重。
2025-11-07 02:35:04
593
原创 Transformer前世今生——掩蔽自注意力计算方法及代码实现(六)
随着AI市场,生成模型的投资热,小编在这里也开了一个Transformer的讲解系列,因为目前主流的大模型其核心都是Transformer,attention is all you need.本系列将介绍Transformer的算法原理以及使用pytorch的实现.本节我们要学习掩蔽自注意力的计算方法。
2025-11-01 05:25:45
894
原创 Transformer前世今生——自注意力(self-attention)与掩蔽自注意力
本文深入解析Transformer模型中自注意力与掩蔽自注意力的核心区别及影响。自注意力机制通过计算词间相似性建立关联,而掩蔽自注意力仅能访问前文信息。文章详细介绍了词嵌入表示、位置编码等关键技术,并对比了两种Transformer架构:Encoder-only模型通过上下文感知嵌入实现文本理解,适用于分类任务;Decoder-only模型采用掩蔽自注意力,专长于文本生成(如ChatGPT)。这一关键差异决定了模型在自然语言处理中的不同应用方向。
2025-10-31 05:10:57
643
原创 Transformer前世今生——Pytorch代码实现(四)
随着AI市场,生成模型的投资热,小编在这里也开了一个Transformer的讲解系列,因为目前主流的大模型其核心都是Transformer,attention is all you need.本系列将介绍Transformer的算法原理以及使用pytorch的实现.注意力机制(Attention)是神经网络中 Transformer 架构的关键组成部分,而 Transformer 正是当前大型语言模型(LLM)和人工智能(AI)热潮的核心驱动力。
2025-10-23 03:50:28
273
原创 Transformer前世今生——原理与矩阵计算(三)
随着AI市场,生成模型的投资热,小编在这里也开了一个Transformer的讲解系列,因为目前主流的大模型其核心都是Transformer,attention is all you need.本系列将介绍Transformer的算法原理以及使用pytorch的实现.
2025-10-23 03:34:12
685
原创 Transformer前世今生——核心思想(二)
随着AI市场,生成模型的投资热,小编在这里也开了一个Transformer的讲解系列,因为目前主流的大模型其核心都是Transformer,attention is all you need.本系列将介绍Transformer的算法原理以及使用pytorch的实现.
2025-10-23 02:46:32
653
原创 Transformer前世今生(一)
随着AI市场,生成模型的投资热,小编在这里也开了一个Transformer的讲解系列,因为目前主流的大模型其核心都是Transformer,attention is all you need.本系列将介绍Transformer的算法原理以及使用pytorch的实现.
2025-10-23 02:35:52
642
原创 Self-Critique Pipeline通过自我批判流程提升LLM的数学能力?
本系列文章探索如何发展可解释性AI生成模型以及其数学能力的提高。大语言模型(LLMs)在掌握人类语言方面表现出色,但在需要数学问题解决能力的实际应用中仍然存在困难。虽然已经开发了许多策略和数据集来增强LLMs的数学能力,但在已部署的LLM系统中同时保持和改进语言和数学能力仍然是一个挑战。在这项工作中,我们定制了自我批评管道,该管道解决了LLM对齐反馈学习阶段的挑战。我们首先从LLM本身训练一个通用的数学批评模型,以提供反馈信号。然后,我们依次采用拒绝微调和直接偏好优化来收集LLM自身生成的数据。
2025-10-21 08:03:01
1080
原创 如何在LLM大语言模型上微调来优化数学推理能力?
摘要 本文研究了大型语言模型(LLMs)在数学计算任务中的内部工作机制。通过设计算术计算数据集,作者采用路径修补技术识别出模型中与计算密切相关的稀疏注意力头(<5%)和后续MLPs。分析表明,这些注意力头专注于操作数和运算符,而MLPs则负责推导答案。实验验证了这些组件的关键作用——敲除它们会导致准确率下降70%。此外,作者提出针对性微调策略,仅调整32个注意力头即可显著提升模型数学能力,且对非数学任务影响较小。这项工作揭示了LLMs执行数学计算的模块化机制,为模型可解释性和能力优化提供了新思路。
2025-10-21 06:23:05
1136
原创 Computer Graphics:从零手写呼吸渐变三角形
这个秋季,三碗饭会开始更新自己在秋季课程的笔记,主要包括Introduction to ML,可能还会有Complier Construction 以及 Computer Graphics.本文将介绍Complier Graphics的知识,主要是从零手写一个可以呼吸的三角形,这是一个很基础的入门项目,我们主要使用的语言是JS。让我们先来看下项目最终结果,
2025-09-24 03:20:13
707
原创 编译器构造:从零手写汇编与反汇编程序(三)
本文介绍了编译器构造课程中关于模拟器(Simulator)的系统实现。文章首先展示了模拟器的整体架构,包括汇编器、指令序列和执行流程的交互关系;然后详细讲解了核心数据结构设计,如模拟器类定义和指令集扩展;接着阐述了关键功能实现,包括指令执行流程、栈操作和错误处理机制;最后提供了测试用例分析和执行流程示例。通过这个模拟器系统,可以执行汇编代码并观察运行时栈的变化,为理解底层计算机制提供了实践基础。
2025-09-21 06:55:32
1103
原创 编译器构造:从零手写汇编与反汇编程序(二)
本文介绍了编译器构造课程中关于汇编器、反汇编器和模拟器的核心知识。汇编器将人类可读的汇编代码(.uma)转为机器码(.um),反汇编器则逆向转换。内容包括指令结构设计(如HALT、ADD等)、关键数据结构(操作码映射表)以及核心功能实现方法。文章提供了完整的C++代码示例,包括初始化映射表、单指令反汇编等核心模块,并展示了测试用例和运行结果。学习这些内容有助于理解计算机底层工作原理,虽然课程可能显得枯燥,但作者会通过简化解释和有趣案例来提升学习体验。
2025-09-21 06:44:00
1070
原创 编译器构造:从零手写汇编与反汇编程序(一)
文章摘要(149字): 本文介绍了编译器构造中关于模拟器、汇编器和反汇编器的实现原理。主要内容包括:汇编器将.uma汇编代码转换为.um机器码,反汇编器执行逆向转换,模拟器则作为虚拟CPU执行机器码。文章详细讲解了指令类型定义、指令结构体设计,以及汇编器类的实现过程,包括初始化指令集、参数数量映射、单行代码汇编和完整程序汇编等核心功能。通过枚举类定义指令类型,结构体封装指令操作码和参数,并提供了将数字转换为二进制字符串的辅助函数。最后展示了如何使用汇编器处理示例程序。
2025-09-08 16:43:38
992
原创 编译器构造:模拟器,汇编与反汇编
文章摘要: 本文介绍了编译器构造中的模拟器、汇编与反汇编知识。主要内容包括:1)编译器与反编译器的用途,如修改程序或绕过软件注册;2)C++程序从源代码到运行的完整流程(预处理、编译、汇编、链接);3)预处理阶段的具体操作(去注释、处理头文件、宏展开、条件编译);4)编译阶段的词法分析过程,将源代码转换为标记流。文章以通俗易懂的方式讲解技术细节,并配有流程图和代码示例,为后续从零编写简易模拟器做铺垫。
2025-09-08 15:14:28
987
原创 秋季课程: 机器学习入门——熵与基尼指数(三)
本文整理机器学习中的熵与基尼指数笔记。熵(E = -ΣP(x)logP(x))衡量数据集不确定性,最大熵出现在均匀分布时。信息量I(x)=log(1/P(x))反映事件意外程度,熵即其期望值。基尼指数(Gini=1-ΣP(x)^2)评估数据多样性,纯数据集值为0。两者均用于决策树划分标准,熵基于对数计算不确定性,基尼指数计算更简单。图示说明概率与熵的关系,P(x)=1时熵为0,均匀分布时熵最大。
2025-08-28 03:20:19
656
原创 秋季课程: 机器学习入门——决策树 (二)
这个秋季,三碗饭会开始更新自己在秋季课程的笔记,主要包括Introduction to ML,可能还会有Complier Construction 以及 Computer Graphics.本文主要记录Machine Learning基础知识。featuressubgroups决策树通过特征将数据划分为子集。在每个节点,算法选择最佳划分标准。classes最终的叶子节点对应类别。
2025-08-28 03:18:46
661
原创 秋季课程: 机器学习入门(一)
这个秋季,三碗饭会开始更新自己在秋季课程的笔记,主要包括Introduction to ML,可能还会有Complier Construction 以及 Computer Graphics.本文主要记录Machine Learning基础知识。
2025-08-28 03:06:57
455
原创 SD1人工智能生成模型知识点学习, 高维/低维,扩散模型(一)
本文介绍了三维重建中的关键概念,重点阐述了高维与低维数据的区别,以及如何通过潜在空间实现数据降维。详细讲解了扩散模型的原理,包括加噪和去噪过程,并深入分析了潜在扩散模型(LDM)的结构和工作机制,特别说明了其在Stable Diffusion(SD1)中的应用。文章还探讨了U-Net架构在潜在空间去噪中的作用,以及如何通过交叉注意力机制实现条件控制生成。这些内容为理解3D生成和3D打印的交叉研究提供了理论基础。
2025-08-06 04:48:15
1133
原创 论文阅读: SketchDream: Sketch-based Text-to-3D Generation and Editing
本文提出SketchDream方法,通过结合手绘草图和文本提示实现3D内容的生成与编辑。针对2D到3D转换的歧义性问题,该方法采用深度引导的多视图图像生成扩散模型,并设计3D注意力控制模块确保3D一致性。对于局部编辑,提出粗到细的双阶段流程:粗阶段生成初始3D掩码标记编辑区域,细阶段通过局部渲染优化细节质量。实验表明,相比现有方法,SketchDream在生成质量、几何控制精度和编辑灵活性方面表现更优。该方法支持从单视图草图生成带纹理的NeRF模型,并能保持未编辑区域不变的同时实现组件级编辑,为3D创作提供
2025-08-05 03:25:57
355
原创 生成式人工智能—— 文本引导的 3D 生成质量标准(八)
本文探讨了文本到3D生成技术的研究进展与挑战,重点分析了保真度、效率、一致性、可控性和多样性等关键指标。当前方法如Dream3D、HD-Fusion等通过引入3D先验和多尺度策略提升了生成质量;Magic3D、3D-CLFusion等采用两阶段优化和潜在表示加速推理;Perp-Neg、MVDream等解决了多视角一致性问题;Control3D、MVControl等结合额外条件输入增强可控性。研究显示,虽然文本到3D生成已取得显著进展,但在工业应用适配、计算效率优化等方面仍需突破。该领域的发展对3D打印、影视
2025-08-03 12:28:26
958
原创 生成式人工智能—— 文本引导的 3D 纹理生成(七)
本文综述了文本引导3D纹理生成的最新研究进展。TEXTure运用深度图像模型实现多视角无缝纹理生成,TANGO通过CLIP模型分解外观风格实现逼真渲染。TexFusion提出3D一致性生成技术提升纹理质量,Text2Tex集成修复机制解决纹理不一致问题。X-Mesh开发文本引导注意力模块加速风格化,CLIP3Dstyler通过点云-文本匹配实现场景风格迁移。PBRGAN则创新性地采用渐进式优化生成高质量人脸纹理。这些方法在提升纹理一致性、真实感和风格化效果方面取得突破,推动了3D内容生成的自动化进程。
2025-08-03 12:10:52
842
原创 生成式人工智能—— 基于文本到3D场景生成(六)
文本引导3D场景生成技术综述 本文综述了文本引导3D场景生成领域的最新研究进展,重点分析了四种主要视角类型及其代表性方法: 面向外部视角:包括Text2Room的文本生成3D网格、Text2NeRF的渐进式补全策略,以及FastScene的高效3D高斯投影技术。 以物体为中心视角:如MAV3D的动态3D场景生成和局部条件扩散方法实现的可控场景合成。 连续视角:SceneScape的永久视角生成和ART3D的艺术风格场景创建。 物体组合视角:CompoNeRF的NeRF编辑重组和Lay-A-Scene的多物体
2025-08-01 05:14:57
1217
原创 生成式人工智能—— 基于文本到3D虚拟人Avatar(五)
本文综述了基于文本驱动的3D虚拟人生成技术最新进展。SMPL参数化人体模型为研究提供了基础框架,而DreamAvatar、AvatarCraft等突破性工作通过结合神经辐射场与扩散模型,实现了高质量、可控姿态的虚拟人生成。研究重点包括提升生成质量与多样性(如Chupa、DreamHuman)、增强可控性与动画性(如AvatarBooth、HeadSculpt)以及探索非文本引导方法(如DressCode)。这些技术显著降低了3D创作门槛,支持从文本直接生成具有特定风格和动作的虚拟人。当前研究正朝着更高真实感
2025-08-01 04:55:45
1285
原创 生成式人工智能—— 基于文本到图像先验方法(四)
本文综述了文本引导3D生成与编辑技术的最新进展。主要包括:1)基于文本到图像先验的3D模型生成;2)文本驱动的3D编辑技术,分为全局编辑(如ClipFace、Instruct 3D-to-3D等方法)和局部编辑(如CompoNeRF、SKED等方法)。局部编辑又细分为用户定义(结合草图等交互)和模型定义(自动识别编辑区域)两种方式。这些方法通过结合CLIP、扩散模型等AI技术,显著提升了3D内容的创建与修改效率,为3D生成与编辑领域带来了新的可能性。
2025-08-01 04:31:10
1027
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅