- 博客(162)
- 资源 (4)
- 收藏
- 关注
原创 马斯克的五步工作法
永远不要接受一项来自某个部内的要求,比如来自“法务部内”或者“安全部内”的要求。提出这项要求的人的名字。聪明人提出的要求才是最下来你应该质疑它,不管这个翻译中危险的,因为人们不太可能质这件事要一直做下去,即便这项要求来自我马斯克本人。我们本应该先质疑所有要求,删除不必要的部分和流程,把问题筛出来、处理掉,然后再推进自动化。事实上,你如果最后加回来的部分还不到删除部分的10%,那就说明你删减得还不够。这应该放在第2步之后,因为人们常犯的错误就是简化和优化一个原本不应该存在的部分或者流程。
2025-12-25 14:21:17
370
原创 不同阶层的人-AI时代
训练数据不少但是都是经过筛选的,带有强归纳偏置,特定领域下表现能到SOTA,基本上都是快速收敛到一个局部最优解,很稳定,但是缺乏创造力和多样性。过度专注于标准化、高度优化的特定技能或体系(例如,只钻研考试技巧、只精通某个极小的专业领域),导致思维僵化、缺乏通用能力,一旦环境变化就会彻底失效。指他们的能力已经达到了**“全能”的境界,拥有极高的综合素质、远见、资源调动能力**,可以掌控复杂的全局,在社会各个层面都处于主导和创造规则的地位。很强,对OOD攻击防御较高,弱偏置,创新强,可以实现通用AGI。
2025-12-11 18:22:09
1020
原创 Attention Is All You Need
,简单来说,就是句子前面出现的词汇可能会在很远的位置对后续内容产生影响,理论上,RNN在处理序列时,每个状态都能追溯到任意远之前的状态信息。如果每个人传话时声音都会变小,比如只有0.2倍,那么连续传递10次后,声音几乎就听不见了(0.2^101.02x10^-7)。而在推理阶段(模型实际运用阶段),虽然不会再出现梯度消失或爆炸,但因为模型在训练阶段无法有效记住长距离的信息,推理时也难以很好地理解或处理长序列的内容。用一个简化的例子来理解,就像传话游戏,每往前传递一人,声音都会有所变化。
2025-12-10 09:35:22
184
原创 学生生应有的能力
6.你不普通,你也不孤单,在考试迷宫之外的那个世界真的很大 应该来说,讲者是希望大家打破思维的墙,与时俱进,不要拘泥于学校教授的那些知识,而是要去发现自己的独特价值,从而适应新的时代需求。----------------------------------一些感悟----------------------------------------3.要发现、激发,并保护那些暂时不被考察的能力(比如动手的能力?2.高考表繁而里简,考察的能力是极为有限的(记忆、数理以及推演)
2025-12-09 15:12:19
138
原创 标量、向量、矩阵、张量
0维张量温度25℃,质量5kg,价格99元1维张量(一排数字)从你家到肯德基:(300米东, 400米北)2维张量(排成一个矩形)电影院座位表、Excel表格、黑白照片3维及以上张量。
2025-12-08 14:15:04
270
原创 HBM 是什么?
HBM 是 AI 芯片的“血液高速路”—— 带宽决定算力上限,没有 HBM,就没有万亿参数大模型的实时训练与推理。它贵、它难造、但它不可替代。
2025-10-31 09:08:41
1286
原创 Blackwell 架构
Blackwell 是 NVIDIA 的 AI 革命性架构,推动从“训练”到“推理”的范式转变,让超大规模 AI 更高效、更经济。
2025-10-31 09:08:11
741
原创 通用计算 VS 加速计算
一句话总结: 通用计算 = “万金油”,适合任何任务; 加速计算 = “专业工具”,在特定领域碾压式领先。现代系统越来越走向 CPU + 多种加速器 的异构协同。
2025-10-29 15:55:23
454
原创 NVLink 72 是什么
NVLink 72 是 NVIDIA(英伟达)在第五代 NVLink 高速互连技术中引入的一个关键概念,主要指它不是一个独立的硬件产品,而是用于大规模 AI 计算系统的架构设计,允许 72 个 GPU 通过 NVLink 互连像一个单一的巨型 GPU 一样工作,从而实现极高的带宽和低延迟通信。
2025-10-29 15:08:15
756
原创 cuPyNumeric 是什么
NVIDIA cuPyNumeric 是 NVIDIA 开发的一款开源 Python 库,旨在提供 NumPy 的分布式和 GPU 加速的 drop-in 替换。它基于 Legate 框架(NVIDIA 的分布式计算抽象层),允许开发者使用零代码更改的方式,将 NumPy 程序从单机笔记本扩展到多 GPU、多节点超级计算机,实现高性能计算(HPC)和大规模数据处理。只需替换导入语句,即可运行:安装与要求(25.03 版) Python: 3.10–3.12 OS: Linux (x
2025-10-29 09:53:06
1139
原创 Aerial Sionna 是什么?
NVIDIA Sionna 是 NVIDIA Aerial 平台的一部分,一款开源的 GPU 加速库,专为 5G 和 6G 无线通信系统的链路级模拟(link-level simulation) 设计。它基于 TensorFlow(或 PyTorch),支持 AI/ML 算法在无线信号处理中的集成,帮助研究人员快速原型化复杂通信架构,如信道估计、均衡和解映射等。Sionna 是 NVIDIA Aerial AI Radio Frameworks 的核心组件之一,用于生成和捕获数据、训练 AI 模型,并模拟无
2025-10-29 09:51:57
660
原创 Parabricks 是什么?
NVIDIA Parabricks 是 NVIDIA 公司开发的一款GPU 加速的基因组分析软件套件,专为下一代测序 (NGS) 的二级分析(secondary analysis)设计。它通过 GPU 的并行计算能力,大幅加速 DNA/RNA 数据的比对、变异调用和分析流程,同时保持与传统工具(如 GATK、BWA)的输出一致性。Parabricks 源于密歇根大学的一个初创公司(2020 年被 NVIDIA 收购),已成为生物信息学领域的标准工具,推动精准医疗和药物发现。Parabricks 以 Dock
2025-10-29 09:49:56
826
原创 NVIDIA MONAI 是什么
NVIDIA MONAI(全称 Medical Open Network for AI)是 NVIDIA 主导的开源 PyTorch 框架,专为医疗成像 AI 设计。它提供领域优化的工具和库,用于开发、训练和部署医疗图像分析模型(如分割、分类、配准),加速从研究到临床应用的流程。MONAI 是 NVIDIA Clara 平台的核心组件,由 NVIDIA 与 King's College London 等机构共同创立,已成为医疗 AI 社区的标准工具。安装与要求(开源版) Python
2025-10-29 09:48:28
1094
原创 Earth-2
NVIDIA Earth-2 是 NVIDIA 公司推出的一款气候数字孪生云平台(Climate Digital Twin Cloud Platform),结合 AI、GPU 加速、物理模拟和计算机图形技术,用于模拟和可视化全球天气与气候预测。它旨在以前所未有的精度和速度(公里级分辨率)处理气候变化问题,帮助科学家、企业和决策者快速生成高分辨率模拟和可视化。Earth-2Studio 是开源框架,用于构建 AI 天气管道。安装后,可运行预训练模型:python安装与要求bash GP
2025-10-29 09:47:07
580
原创 cuQuantum 量子计算
它们共同推动从 NISQ 到容错量子计算的跃迁,预计 2030 年将成为量子 AI 标准工具。数据来源:NVIDIA Eos 超级计算机测试。这在 CPU 上会挂起,但 GPU 上毫秒完成。
2025-10-29 09:46:05
1110
原创 cu DF是什么
cuDF(全称 CUDA DataFrame)是 NVIDIA RAPIDS 生态的核心组件之一,是一款 GPU 加速的 DataFrame 库,功能与 Python 的 Pandas 完全对标,但在 GPU 上运行,速度提升 10–100 倍。输出:text与 RAPIDS 生态无缝集成官方资源 资源 链接 官网 https://rapids.ai cuDF 文档 docs.rapids.ai/
2025-10-29 09:36:43
667
原创 Warp是什么
基于上下文(你之前询问了 cuLitho、cuDSS、cuOpt 等 NVIDIA CUDA-X 库),我推测“nvidia wrap”可能是“NVIDIA Warp”的拼写变体。NVIDIA Warp 是一个,专为而设计。它允许开发者使用 Python 编写 GPU 加速的内核程序,适用于 AI、机器人、机器学习和图形模拟等领域。Warp 通过即时编译(JIT)将 Python 函数转换为高效的 x86 或 CUDA 内核代码,实现与原生 CUDA 相当的性能,同时保持 Python 的易用性。
2025-10-29 09:29:37
351
原创 cu Opt 是什么
NVIDIA cuOpt是一款GPU加速的AI决策优化引擎,专注于解决大规模复杂优化问题。其核心优势在于:采用GPU并行计算(如H100/B100),实现超高速求解(69K约束LP<0.3秒)和百万级变量处理;支持LP/MILP和车辆路径问题(VRP),相比CPU提速5000倍以上;提供便捷的API和容器化部署(<5分钟启动)。该技术已广泛应用于物流、供应链和能源领域,如宝马车队优化、铁路检查调度等场景,显著提升运营效率并降低成本。作为NVIDIA AI Enterprise组件,cuOpt预计
2025-10-29 09:27:00
414
原创 cu DSS 是什么
NVIDIA cuDSS是一款GPU加速的专用稀疏矩阵求解库,采用混合异构架构优化高性能计算。其核心特点包括支持多种因子分解算法、多阶段工作流程和高效内存管理。相比传统CPU求解器,cuDSS在处理大型稀疏矩阵时能实现4倍以上加速,在工程模拟、实时系统等领域有显著优势。目前集成于Ansys等专业软件,支持多GPU计算和超级芯片优化。作为CUDA-X生态的重要组件,cuDSS通过GPU并行计算解决了科学计算中的关键瓶颈问题,为AI和工程模拟提供强大支持,预计未来将更广泛应用于HPC领域。
2025-10-29 09:24:17
486
原创 cu Litho是什么
cuLitho(全称 NVIDIA cuLitho)是 NVIDIA 公司开发的一款,专为**计算光刻(Computational Lithography)**优化设计。它是半导体制造流程中的关键工具,用于加速芯片生产中的光掩模(photomask)设计和计算过程。
2025-10-29 09:15:05
356
原创 China‘s Demand for New Homes to Stay Low
高盛,China's Demand for New Homes to Stay Low
2025-06-24 09:34:58
1165
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅