- 博客(635)
- 资源 (10)
- 收藏
- 关注
原创 AI芯片行业深度:发展现状、竞争格局、市场空间及相关公司深度梳理
从AIGC产业链出发了解AI芯片在产业链中的地位及作用,分析不同类别的AI芯片的作用及特性都有哪些,我国AI芯片行业现状及竞争格局是怎样的,目前全球AI芯片的四大技术路线都有哪些?chatGPT及“文心一言”的出现对于AI芯片市场又怎样的影响,市场空间有多大,相关公司都有哪些,未来有怎样的发展趋势?
2024-03-05 17:13:24 3679
原创 ChatGPT带火的HBM是什么?
HBM(High Bandwidth Memory)即高带宽存储器,是基于硅通孔(TSV)和微凸点(Microbump)技术将多个DRAMdie和Logicdie堆叠而成的具有三维结构的存储产品。
2024-02-26 10:49:56 1716
原创 从ChatGPT到Sora,来了解大模型训练中的存储
清华大学舒继武团队分析了大模型训练的存储挑战,指出大模型训练的存储需求大,且具有独特的计算模式、访存模式、数据特征,这使得针对互联网、大数据等应用的传统存储技术在处理大模型训练任务时效率低下,且容错开销大;分别阐述了针对大模型训练的3类存储加速技术与2类存储容错技术;并进行了总结和展望。
2024-02-24 23:22:19 3237
原创 OpenAI Sora模型,官方技术文档翻译
本技术报告的重点是(1)将所有类型的视觉数据转化为统一表示,从而能够大规模训练生成模型的方法;以及(2)对Sora的能力和局限性的定性评估。
2024-02-23 01:00:00 1174
原创 Groq大模型推理芯片每秒500tokens超越GPU?
Groq的处理器是LPU(Language Processing Unit,语言处理单元),可以为诸如AI语言应用程序(LLM)等提供最快的推理速度。取胜的核心技术是Groq首创的LPU技术。
2024-02-23 00:30:00 1837
转载 聊透 GPU 通信技术——GPU Direct、NVLink、RDMA
最近人工智能大火,AI 应用所涉及的技术能力包括语音、图像、视频、NLP 等多方面,而这些都需要强大的计算资源支持。AI 技术对算力的需求是非常庞大的,虽然 GPU 的计算能力在持续提升,但是对于 AI 来说,单卡的计算能力就算再强,也是有极限的,这就需要多 GPU 组合。而 GPU 多卡的组合,主要分为单个服务器多张 GPU 卡和多个服务器,每个服务器多张卡这两种情况,无论是单机多卡还是多机多卡,GPU 之间需要有超强的通信支持。接下来,我们就来聊聊 GPU 通信技术。
2024-02-22 11:32:28 942
转载 中金:从OpenAI Sora看视频生成模型技术进展
延续DiTs架构,Sora实现高质量长视频生成。根据技术报告,Sora延续DiTs架构,随训练计算量提升而展现出显著的生成能力提升(Scalable)。
2024-02-22 10:01:41 133
原创 存内计算的主流技术方案
存内计算直接使用内存单元做计算,主要利用电阻和电流电压的物理关系表达运算过程。存内计算依赖于新型的非易失性存储器,如 ReRAM和 PCM 等。
2024-02-22 01:30:00 2147
原创 近数据计算的主流技术方案
近数据计算中逻辑层的设计较为灵活,可以针对不同系统的需求设计通用的处理器或者专用的加速器。在设计针对通用应用的近数据计算系统时,由于放到内存端的通用处理器一般性能较弱,需要考虑自动化地分割应用程序的计算部分,把能从近数据计算中获益的部分放到内存中处理.在设计针对特定类型应用的近数据计算系统时,需要仔细分析应用特点,抽取算子,设计对应的数据流. 除了逻辑层的设计,近数据计算系统结构设计还需要考虑:各个内存块之间的连接方式,包括通信方式和数据一致性协议、数据映射策略、与现有系统集成方式、软硬件接口设计。
2024-02-22 00:30:00 1902
原创 内存计算研究进展- 针对图计算的近数据计算架构
针对图计算的近数据计算架构的代表性工作有: Seoul National University的 Tesseract和 Georgia Institute of Technology 的 GraphPIM,具体如下。
2024-02-21 00:45:00 412
原创 内存计算:起源、架构、挑战与机遇
在数据爆炸时代,内存计算技术为解决传统冯•诺依曼架构中总线拥堵问题以及片上片下数据传输能耗过高问题提供了解决方案.内存计算技术得益于新型3D 堆叠技术和非易失存储技术的发展。
2024-02-21 00:45:00 1357
原创 内存计算研究进展-针对机器学习的近数据计算架构
针对机器学习的近数据计算架构代表性工作有: Georgia Institute of Technology的BSSync (bounded staled sync) 和 Neurocube,Advanced Micro Devices 的 CoML,具体如下。
2024-02-21 00:15:00 1992 1
转载 智能计算: 最新进展、挑战和未来(九名院士、12位专家)
计算是人类文明发展的一个重要推动力。近年来,我们见证了智能计算的出现,在大数据、人工智能和物联网时代,智能计算作为一种新的计算范式,正在重塑传统计算,以新的计算理论、架构、方法、系统和应用推动数字革命。
2024-02-20 11:05:55 599
原创 内存计算研究进展-通用的近数据计算架构
TOM的提出是为了解决大数据时代GPU与主存之间带宽小的问题,除了通过编译器静态分析代码块并选择合适的代码块放到内存计算中执行之外,TOM还分析预测了哪些数据会被放到内存计算中的代码块访问,并将这些数据放在相应代码块执行的NDC cube中,以此来减少各个NDC cube之间的通信. TOM中的代码分析和数据映射都对上层透明,程序员可非常方便地使用内存计算.实验显示,TOM平均能提高GPU的主流应用30%的性能。实验表明,在22nm的工艺下,TOP-PIM可以减少76%的能耗,且仅带来27%的性能损失。
2024-02-20 04:15:00 1828
原创 内存计算研究进展-技术架构
内存计算技术是一个宏观的概念,是将计算能力集成到内存中的技术统称。集成了内存计算技术的计算机系统不仅能直接在内存中执行部分计算,还能支持传统以CPU为核心的应用程序的执行。,常用于嵌入式设备中,针对一类特定的应用设计,不能处理其他应用程序。内存计算包括两大类:近数据计算和存内计算。两者的关系如图4 所示,它们在形式上不同,但是在特定场景下可以融合设计。,而,计算和存储紧耦合.下面将从硬件结构和所支持的计算操作两个方面具体介绍近数据计算和存内计算相关技术。
2024-02-20 00:15:00 1656
原创 内存计算研究进展-提出与兴起
数据驱动的应用迅猛发展以及数据量指数级暴增驱动了内存计算的发展,并且新型存储器件的快速发展为内存计算提供了技术保障。因此,内存计算在2010年后兴起。
2024-02-19 12:20:30 995
原创 初识eBPF
eBPF 是一项革命性的技术,它能在操作系统内核中运行沙箱程序。被用于安全并有效地扩展内核的能力而无需修改内核代码或者加载内核模块。
2024-02-19 09:37:19 1737
原创 [Flink04] Flink部署实践
Standalone模式是最简单的一种集群模式,不需要Yarn、mesos等资源调度平台,自带集群,资源管理由flink集群管理,开发环境测试使用。Standalone模式是一种主从模式,主要有两个组件构成分别是JobManager(Master)和TaskManager(Slave)。当一个应用提交执行时,Flink的各个组件是如何交互协作的:1)App程序通过rest接口提交给Dispatcher(rest接口是跨平台,并且可以直接穿过防火墙,不需考虑拦截)。
2024-02-18 16:58:27 1551
原创 [Flink03] Flink安装
在Flink Standalone模式下,实现HA的方式可以利用ZooKeeper在所有正在运行的JobManager实例之间进行分布式协调,实现多个JobManager无缝切换。Flink Standalone模式的HA架构如图:HA的核心就是:可以在集群中启动多个JobManager,并使它们都向ZooKeeper进行注册,ZooKeeper利用自身的选举机制保证同一时间只有一个JobManager是活动状态(Active)的,其他的都是备用状态(Standby)。
2024-02-18 16:28:43 1672
原创 [Flink02] Flink架构和原理
这是继第一节之后的Flink入门系列的第二篇,本篇主要内容是是:了解Flink运行模式、Flink调度原理、Flink分区、Flink安装。
2024-02-18 16:26:11 1348
原创 [Flink01] 了解Flink
link就是个实时处理数据任务的框架,这个框架帮助开发者执行数据处理的任务,让开发者无需关心高可用、性能等问题。
2024-02-18 16:24:40 1236
原创 【芯片论文】存内计算(CIM)与近存计算(CNM)论文总结
本文总结了存内计算(CIM:Computing In Memory)、存内处理(PIM:Processing In Memory)、近存处理(PNM:Processing Near Memory)、近存计算(PNM:Computing Near Memory)领域的一些论文,可作为研究、学习、开发的参考资料。
2024-02-07 04:15:00 2426
原创 MRAM存内计算:现状及挑战
随着人工智能、物联网、智能传感等应用的快速兴起,数据以爆发式的速度增长。海量数据的高效存储、迁移与处理成为当前信息领域的重大挑战。受限于经典的冯诺依曼计算架构存储与处理分离的特性,在面向大数据分析等应用场景中,数据总线的带宽严重制约了处理器的性能与能量效率,并且数据的频繁迁移带来严重的传输功耗问题。存内计算架构在此基础上应运而生。通过赋予存储器计算功能,以数据为中心,避免不必要的数据频繁搬运,降低系统的功耗和延时。
2024-02-07 00:45:00 2102
原创 近存计算与内存计算
近存计算 (near memory computing) 和存内计算 (in-memory computing) 有时可以互换使用并且容易混淆。本章旨在阐明各种近存和存内计算方法的分类,并对每类内存驱动方法的显著特征进行比较。另外,可计算内存设备可以被实现为独立加速器设备或替换当前内存层次中的内存模块。我们将探讨每种方法带来的好处和挑战。
2024-02-06 15:45:26 1750
原创 集群clickhouse使用和clickhouse索引的使用
ClickHouse支持多种索引类型,包括普通索引、范围索引、哈希索引、倒排索引等。使用索引可以加快查询速度和提高查询效率。
2024-02-06 02:30:00 1212
原创 ClickHouse表常用引擎
1、重新启动服务器时,表中的数据消失,表将变为空。通常,使用此表引擎是不合理的。(值得注意的是,在许多情况下,与 MergeTree 引擎的性能几乎一样高)。1、自动跟踪传递的消息,因此组中的每条消息仅计算一次。4、分布式引擎参数:服务器配置文件中的集群名,远程数据库名,远程表名,数据分片键(可选)2、引擎支持索引,通过主键和日期来构建索引, 同时提供 数据的实时更新能力.4、以未压缩的形式将数据存储在内存中。2、读取时,远程服务器表的索引(如果有的话)会被使用。3、从这张表中读取是很轻松的。
2024-02-05 20:43:36 1000
原创 鸿蒙内核框架
用户最常见到并与之交互的操作系统界面,其实只是操作系统最外面的一层。操作系统最重要的任务,包括管理硬件设备,分配系统资源等,我们称之为操作系统内在最重要的核心功能。
2024-02-05 16:31:09 7052 5
原创 存算一体:架构创新,打破算力极限
在全球数据量呈指数级暴涨,算力相对于AI运算供不应求的现状下,存算一体技术主要解决高算力带来的高能耗成本矛盾问题,有望实现降低一个数量级的单位算力能耗,在功耗敏感的高能耗数据中心、自动驾驶等领域有望发挥其低功耗、低时延、高算力密度等优势。
2024-02-03 20:59:45 2219 1
原创 计算存储设备(Computational Storage Drive, CSD)
计算存储SSD(CSSD)的发展并未如早期倡导者所预期那样推进。尽管一些公司曾积极推广将该架构用作可编程设备,但实际增长点似乎更多地来自不同应用场景。部分早期进入该领域的厂商已退出市场,而另一些则在竞争中存活下来。
2024-02-02 18:20:14 1321
原创 存内计算——发展史与近期成果
存内计算的概念早在上个世纪就已经被提出,但当时的人们寄希望于通过优化处理器设计以及工艺制程的升级,来获得性能和能效比的提升,存内计算的研究仅停留在理论阶段。随着大数据时代的到来,存内计算由于其结构特点以及摩尔定律的“失效”,被认为是提升处理器能效和性能以及加速神经网络运算的新出路。接下来我们将从存内计算的源头出发,介绍它的发展史与近期取得的成果。
2024-02-01 09:02:32 1741
原创 白皮书 | 分布式存储发展白皮书(2023)
12月1日,在2023云原生产业大会上,中国信通院云大所联合华为、戴尔科技、IBM等分布式存储产业方阵成员单位共同发布《分布式存储发展白皮书(2023年)》
2023-12-08 08:58:54 1018
原创 [FAST23论文导读]More Than Capacity- Performance-oriented Evolution of Pangu in Alibaba
本文介绍了Pangu存储系统如何不断地随着硬件技术和业务模型的发展而不断演进,提供具有100us级I/O延迟的高性能、可靠的存储服务。
2023-11-19 20:25:51 1191
原创 论文导读:fast21 Learning Cache Replacement with Cacheus
CACHEUS建立在LeCaR的成功之上。它在几个方面对LeCaR进行了改进。首先,虽然LeCaR主张使用经典的LRU和LFU,CACHEUS证明了使用更复杂的专家的重要性。其次,CACHEUS通过识别和消除其机器学习机制的冗余方面简化了LeCaR。第三,它创建了一个完全自适应的版本,也是轻量级的。最后,新的轻量级专家SR-LRU和CR-LFU改进了LeCaR的专家,以解决扫描和搅动这两个新的工作负载原语类型。通过这些改进,CACHEUS的表现优于LeCaR以及其他最先进的算法。
2023-11-12 22:57:13 1632
原创 【sosp23论文导读】Ditto:一个弹性自适应分离式内存缓存系统
Ditto首先提出了一个以客户端为中心的缓存框架,以在DM的计算池中高效地执行各种缓存算法,只依赖于远程内存访问。然后,Ditto采用了一种分布式自适应缓存方案,该方案基于多个缓存算法的实时性能自适应切换到最适合的缓存算法,以提高缓存命中率。
2023-11-04 19:15:25 1391
转载 布隆过滤器技术原理及应用实战
在我之前实现的个人项目——分布式定时器 xtimer 中就使用到了布隆过滤器作为任务幂等性校验的辅助工具.该项目详细介绍见文章——基于协程池架构实现分布式定时器 XTimerxtimer 架构图如下:在 xtimer 中,定时任务的实际执行聚焦在执行器 executor 模块,是由上游 trigger 模块异步启动的,只能通过一种类似于 ack 的分片过期时间延长操作,保证到定时任务满足 at least once 的语义,但无法做到 exactly once 的语义.
2023-09-25 19:12:58 1640
原创 2023年企业级存储主要发展趋势
到2027年,有25%的企业组织计划采用NVMe-oF存储网络协议,相对于2023年中期不到10%的采用率,呈现出明显的增长趋势。截至2026年,专用NVMe SSD将在本地化部署中占据超过30%的份额,相较于2023年中期不到5%的水平,呈现出明显的增长趋势。到2028年,将有70%的文件和对象数据部署在一个统一的非结构化数据存储平台上,从2023年初的35%增加到70%。到2027年,至少40%的组织将部署数据存储管理解决方案,用于分类、洞察和优化,从2023年初的15%增加到40%。
2023-09-20 09:03:51 1933 1
原创 2023年非结构化数据管理报告
采用分析、分类和分段数据的工具和实践可以导致细致入微的数据管理策略:低优先级的数据存储在存档存储中,直到需要进行活动使用或可以删除为止,而高优先级的活动数据保留在最昂贵的顶级存储中。这些问题包括从敏感数据泄露到威胁公司知识产权和个人身份信息保护的通用语言学习模型(LLMs),再到伦理、准确性、数据源溯源的担忧,以及派生作品的版权问题,甚至是恶意行为者可能造成的威胁,这些都是企业和社会需要认真面对的问题。当前的AI浪潮迅速塑造了新的工作方式,带来了显著的生产率提升,改变了产品和服务的创造与分发方式。
2023-09-20 09:00:08 2014
原创 各种存储性能瓶颈如何分析与优化?
分布式存储系统的核心设计思想是去中心化, 去中心化的难点主要在于是主控节点的去中心化,有主控节点的架构比如 HDFS 的架构设计思路是 map-reduce ,化大为小,分而治之,再合并处理,其架构中需要主控节点来协调,只是主控节点的负载都分发到了数据节点,数据节点上则存放着数据副本,每个数据副本又都分布在三个不同的数据节点上,如图 5 所示;随着数字化转型的深入,企业的 IT 系统建设也进一步加快,这一方面带来了数据量的急剧增长,另一方面也提高了数据的访问频率,存储的性能瓶颈的影响也会被进一步放大。
2023-09-19 08:59:41 2026
大模型专题报告:百模渐欲迷人眼,AI应用繁花开
2024-03-07
存储专题系列一:新应用发轫,存力升级大势所趋
2024-03-06
AI智算时代:算力芯片加速升级
2024-03-06
翻译分布式文件系统:BeeGFS vs GlusterFS.pdf
2023-08-16
2023东北证券-计算机行业AI深度报告,向量数据库:AI时代的Killer+App-230508.pdf
2023-08-15
计算机:CPU生态价值与机遇研究.pdf
2023-08-15
大数据+物联网智慧水务解决方案.pdf
2023-08-15
2022中国图计算技术及应用发展研究报告.pdf
2023-08-15
金融行业信创云基础架构方案评估.pdf
2023-08-15
计算产业发展简史及趋势
2023-08-15
2021全球加密技术发展趋势研究
2023-08-15
2022 分布式存储市场调研报告 + 分布式存储
2022-05-18
下一代数据存储技术研究报告(2021年)
2021-08-01
fio-2.14.tar.bz2
2017-05-03
Linux中LCD设备驱动
2013-11-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人