YoungerChina-CSDN博客

原创 AI芯片行业深度：发展现状、竞争格局、市场空间及相关公司深度梳理

从AIGC产业链出发了解AI芯片在产业链中的地位及作用，分析不同类别的AI芯片的作用及特性都有哪些，我国AI芯片行业现状及竞争格局是怎样的，目前全球AI芯片的四大技术路线都有哪些？chatGPT及“文心一言”的出现对于AI芯片市场又怎样的影响，市场空间有多大，相关公司都有哪些，未来有怎样的发展趋势？

2024-03-05 17:13:24 3679

原创 ChatGPT带火的HBM是什么？

HBM（High Bandwidth Memory）即高带宽存储器，是基于硅通孔（TSV）和微凸点（Microbump）技术将多个DRAMdie和Logicdie堆叠而成的具有三维结构的存储产品。

2024-02-26 10:49:56 1716

原创从ChatGPT到Sora，来了解大模型训练中的存储

清华大学舒继武团队分析了大模型训练的存储挑战，指出大模型训练的存储需求大，且具有独特的计算模式、访存模式、数据特征，这使得针对互联网、大数据等应用的传统存储技术在处理大模型训练任务时效率低下，且容错开销大；分别阐述了针对大模型训练的3类存储加速技术与2类存储容错技术；并进行了总结和展望。

2024-02-24 23:22:19 3237

原创 OpenAI Sora模型，官方技术文档翻译

本技术报告的重点是（1）将所有类型的视觉数据转化为统一表示，从而能够大规模训练生成模型的方法；以及（2）对Sora的能力和局限性的定性评估。

2024-02-23 01:00:00 1174

原创 Groq大模型推理芯片每秒500tokens超越GPU?

Groq的处理器是LPU（Language Processing Unit，语言处理单元），可以为诸如AI语言应用程序（LLM）等提供最快的推理速度。取胜的核心技术是Groq首创的LPU技术。

2024-02-23 00:30:00 1837

转载聊透 GPU 通信技术——GPU Direct、NVLink、RDMA

最近人工智能大火，AI 应用所涉及的技术能力包括语音、图像、视频、NLP 等多方面，而这些都需要强大的计算资源支持。AI 技术对算力的需求是非常庞大的，虽然 GPU 的计算能力在持续提升，但是对于 AI 来说，单卡的计算能力就算再强，也是有极限的，这就需要多 GPU 组合。而 GPU 多卡的组合，主要分为单个服务器多张 GPU 卡和多个服务器，每个服务器多张卡这两种情况，无论是单机多卡还是多机多卡，GPU 之间需要有超强的通信支持。接下来，我们就来聊聊 GPU 通信技术。

2024-02-22 11:32:28 942

转载中金：从OpenAI Sora看视频生成模型技术进展

延续DiTs架构，Sora实现高质量长视频生成。根据技术报告，Sora延续DiTs架构，随训练计算量提升而展现出显著的生成能力提升（Scalable）。

2024-02-22 10:01:41 133

原创存内计算的主流技术方案

存内计算直接使用内存单元做计算，主要利用电阻和电流电压的物理关系表达运算过程。存内计算依赖于新型的非易失性存储器，如 ReRAM和 PCM 等。

2024-02-22 01:30:00 2147

原创近数据计算的主流技术方案

近数据计算中逻辑层的设计较为灵活，可以针对不同系统的需求设计通用的处理器或者专用的加速器。在设计针对通用应用的近数据计算系统时，由于放到内存端的通用处理器一般性能较弱，需要考虑自动化地分割应用程序的计算部分，把能从近数据计算中获益的部分放到内存中处理.在设计针对特定类型应用的近数据计算系统时，需要仔细分析应用特点，抽取算子，设计对应的数据流. 除了逻辑层的设计，近数据计算系统结构设计还需要考虑：各个内存块之间的连接方式，包括通信方式和数据一致性协议、数据映射策略、与现有系统集成方式、软硬件接口设计。

2024-02-22 00:30:00 1902

原创内存计算研究进展- 针对图计算的近数据计算架构

针对图计算的近数据计算架构的代表性工作有： Seoul National University的 Tesseract和 Georgia Institute of Technology 的 GraphPIM，具体如下。

2024-02-21 00:45:00 412

原创内存计算：起源、架构、挑战与机遇

在数据爆炸时代，内存计算技术为解决传统冯•诺依曼架构中总线拥堵问题以及片上片下数据传输能耗过高问题提供了解决方案.内存计算技术得益于新型3D 堆叠技术和非易失存储技术的发展。

2024-02-21 00:45:00 1357

原创内存计算研究进展-针对机器学习的近数据计算架构

针对机器学习的近数据计算架构代表性工作有： Georgia Institute of Technology的BSSync (bounded staled sync) 和 Neurocube，Advanced Micro Devices 的 CoML，具体如下。

2024-02-21 00:15:00 1992 1

转载智能计算：最新进展、挑战和未来（九名院士、12位专家）

计算是人类文明发展的一个重要推动力。近年来，我们见证了智能计算的出现，在大数据、人工智能和物联网时代，智能计算作为一种新的计算范式，正在重塑传统计算，以新的计算理论、架构、方法、系统和应用推动数字革命。

2024-02-20 11:05:55 599

原创内存计算研究进展-通用的近数据计算架构

TOM的提出是为了解决大数据时代GPU与主存之间带宽小的问题，除了通过编译器静态分析代码块并选择合适的代码块放到内存计算中执行之外，TOM还分析预测了哪些数据会被放到内存计算中的代码块访问，并将这些数据放在相应代码块执行的NDC cube中，以此来减少各个NDC cube之间的通信. TOM中的代码分析和数据映射都对上层透明，程序员可非常方便地使用内存计算.实验显示，TOM平均能提高GPU的主流应用30%的性能。实验表明，在22nm的工艺下，TOP-PIM可以减少76%的能耗，且仅带来27%的性能损失。

2024-02-20 04:15:00 1828

原创内存计算研究进展-技术架构

内存计算技术是一个宏观的概念，是将计算能力集成到内存中的技术统称。集成了内存计算技术的计算机系统不仅能直接在内存中执行部分计算，还能支持传统以CPU为核心的应用程序的执行。，常用于嵌入式设备中，针对一类特定的应用设计，不能处理其他应用程序。内存计算包括两大类：近数据计算和存内计算。两者的关系如图4 所示，它们在形式上不同，但是在特定场景下可以融合设计。，而，计算和存储紧耦合.下面将从硬件结构和所支持的计算操作两个方面具体介绍近数据计算和存内计算相关技术。

2024-02-20 00:15:00 1656

原创内存计算研究进展-提出与兴起

数据驱动的应用迅猛发展以及数据量指数级暴增驱动了内存计算的发展，并且新型存储器件的快速发展为内存计算提供了技术保障。因此，内存计算在2010年后兴起。

2024-02-19 12:20:30 995

原创初识eBPF

eBPF 是一项革命性的技术，它能在操作系统内核中运行沙箱程序。被用于安全并有效地扩展内核的能力而无需修改内核代码或者加载内核模块。

2024-02-19 09:37:19 1737

原创 [Flink04] Flink部署实践

Standalone模式是最简单的一种集群模式，不需要Yarn、mesos等资源调度平台，自带集群，资源管理由flink集群管理，开发环境测试使用。Standalone模式是一种主从模式，主要有两个组件构成分别是JobManager（Master）和TaskManager（Slave）。当一个应用提交执行时，Flink的各个组件是如何交互协作的：1）App程序通过rest接口提交给Dispatcher（rest接口是跨平台，并且可以直接穿过防火墙，不需考虑拦截）。

2024-02-18 16:58:27 1551

原创 [Flink03] Flink安装

在Flink Standalone模式下，实现HA的方式可以利用ZooKeeper在所有正在运行的JobManager实例之间进行分布式协调，实现多个JobManager无缝切换。Flink Standalone模式的HA架构如图：HA的核心就是：可以在集群中启动多个JobManager，并使它们都向ZooKeeper进行注册，ZooKeeper利用自身的选举机制保证同一时间只有一个JobManager是活动状态（Active）的，其他的都是备用状态（Standby）。

2024-02-18 16:28:43 1672

原创 [Flink02] Flink架构和原理

这是继第一节之后的Flink入门系列的第二篇，本篇主要内容是是：了解Flink运行模式、Flink调度原理、Flink分区、Flink安装。

2024-02-18 16:26:11 1348

原创 [Flink01] 了解Flink

link就是个实时处理数据任务的框架，这个框架帮助开发者执行数据处理的任务，让开发者无需关心高可用、性能等问题。

2024-02-18 16:24:40 1236

原创【芯片论文】存内计算(CIM)与近存计算(CNM)论文总结

本文总结了存内计算(CIM：Computing In Memory)、存内处理(PIM：Processing In Memory)、近存处理(PNM：Processing Near Memory)、近存计算(PNM：Computing Near Memory)领域的一些论文，可作为研究、学习、开发的参考资料。

2024-02-07 04:15:00 2426

原创 MRAM存内计算：现状及挑战

随着人工智能、物联网、智能传感等应用的快速兴起，数据以爆发式的速度增长。海量数据的高效存储、迁移与处理成为当前信息领域的重大挑战。受限于经典的冯诺依曼计算架构存储与处理分离的特性，在面向大数据分析等应用场景中，数据总线的带宽严重制约了处理器的性能与能量效率，并且数据的频繁迁移带来严重的传输功耗问题。存内计算架构在此基础上应运而生。通过赋予存储器计算功能，以数据为中心，避免不必要的数据频繁搬运，降低系统的功耗和延时。

2024-02-07 00:45:00 2102

原创近存计算与内存计算

近存计算 (near memory computing) 和存内计算 (in-memory computing) 有时可以互换使用并且容易混淆。本章旨在阐明各种近存和存内计算方法的分类，并对每类内存驱动方法的显著特征进行比较。另外，可计算内存设备可以被实现为独立加速器设备或替换当前内存层次中的内存模块。我们将探讨每种方法带来的好处和挑战。

2024-02-06 15:45:26 1750

原创集群clickhouse使用和clickhouse索引的使用

ClickHouse支持多种索引类型，包括普通索引、范围索引、哈希索引、倒排索引等。使用索引可以加快查询速度和提高查询效率。

2024-02-06 02:30:00 1212

原创 ClickHouse表常用引擎

1、重新启动服务器时，表中的数据消失，表将变为空。通常，使用此表引擎是不合理的。（值得注意的是，在许多情况下，与 MergeTree 引擎的性能几乎一样高）。1、自动跟踪传递的消息，因此组中的每条消息仅计算一次。4、分布式引擎参数：服务器配置文件中的集群名，远程数据库名，远程表名，数据分片键（可选）2、引擎支持索引，通过主键和日期来构建索引, 同时提供数据的实时更新能力.4、以未压缩的形式将数据存储在内存中。2、读取时，远程服务器表的索引（如果有的话）会被使用。3、从这张表中读取是很轻松的。

2024-02-05 20:43:36 1000

原创鸿蒙内核框架

用户最常见到并与之交互的操作系统界面，其实只是操作系统最外面的一层。操作系统最重要的任务，包括管理硬件设备，分配系统资源等，我们称之为操作系统内在最重要的核心功能。

2024-02-05 16:31:09 7052 5

原创存算一体：架构创新，打破算力极限

在全球数据量呈指数级暴涨，算力相对于AI运算供不应求的现状下，存算一体技术主要解决高算力带来的高能耗成本矛盾问题，有望实现降低一个数量级的单位算力能耗，在功耗敏感的高能耗数据中心、自动驾驶等领域有望发挥其低功耗、低时延、高算力密度等优势。

2024-02-03 20:59:45 2219 1

原创计算存储设备（Computational Storage Drive, CSD）

计算存储SSD（CSSD）的发展并未如早期倡导者所预期那样推进。尽管一些公司曾积极推广将该架构用作可编程设备，但实际增长点似乎更多地来自不同应用场景。部分早期进入该领域的厂商已退出市场，而另一些则在竞争中存活下来。

2024-02-02 18:20:14 1321

原创存内计算——发展史与近期成果

存内计算的概念早在上个世纪就已经被提出，但当时的人们寄希望于通过优化处理器设计以及工艺制程的升级，来获得性能和能效比的提升，存内计算的研究仅停留在理论阶段。随着大数据时代的到来，存内计算由于其结构特点以及摩尔定律的“失效”，被认为是提升处理器能效和性能以及加速神经网络运算的新出路。接下来我们将从存内计算的源头出发，介绍它的发展史与近期取得的成果。

2024-02-01 09:02:32 1741

原创白皮书 | 分布式存储发展白皮书（2023）

12月1日，在2023云原生产业大会上，中国信通院云大所联合华为、戴尔科技、IBM等分布式存储产业方阵成员单位共同发布《分布式存储发展白皮书（2023年）》

2023-12-08 08:58:54 1018

原创 [FAST23论文导读]More Than Capacity- Performance-oriented Evolution of Pangu in Alibaba

本文介绍了Pangu存储系统如何不断地随着硬件技术和业务模型的发展而不断演进，提供具有100us级I/O延迟的高性能、可靠的存储服务。

2023-11-19 20:25:51 1191

原创论文导读：fast21 Learning Cache Replacement with Cacheus

CACHEUS建立在LeCaR的成功之上。它在几个方面对LeCaR进行了改进。首先，虽然LeCaR主张使用经典的LRU和LFU，CACHEUS证明了使用更复杂的专家的重要性。其次，CACHEUS通过识别和消除其机器学习机制的冗余方面简化了LeCaR。第三，它创建了一个完全自适应的版本，也是轻量级的。最后，新的轻量级专家SR-LRU和CR-LFU改进了LeCaR的专家，以解决扫描和搅动这两个新的工作负载原语类型。通过这些改进，CACHEUS的表现优于LeCaR以及其他最先进的算法。

2023-11-12 22:57:13 1632

原创【sosp23论文导读】Ditto：一个弹性自适应分离式内存缓存系统

Ditto首先提出了一个以客户端为中心的缓存框架，以在DM的计算池中高效地执行各种缓存算法，只依赖于远程内存访问。然后，Ditto采用了一种分布式自适应缓存方案，该方案基于多个缓存算法的实时性能自适应切换到最适合的缓存算法，以提高缓存命中率。

2023-11-04 19:15:25 1391

原创论文阅读笔记（Clover: 计算与存储被动分离的分布式键值存储系统）

关于这篇论文的笔记。

2023-10-09 12:39:01 3029

转载布隆过滤器技术原理及应用实战

在我之前实现的个人项目——分布式定时器 xtimer 中就使用到了布隆过滤器作为任务幂等性校验的辅助工具.该项目详细介绍见文章——基于协程池架构实现分布式定时器 XTimerxtimer 架构图如下：在 xtimer 中，定时任务的实际执行聚焦在执行器 executor 模块，是由上游 trigger 模块异步启动的，只能通过一种类似于 ack 的分片过期时间延长操作，保证到定时任务满足 at least once 的语义，但无法做到 exactly once 的语义.

2023-09-25 19:12:58 1640

原创 2023年企业级存储主要发展趋势

到2027年，有25%的企业组织计划采用NVMe-oF存储网络协议，相对于2023年中期不到10%的采用率，呈现出明显的增长趋势。截至2026年，专用NVMe SSD将在本地化部署中占据超过30%的份额，相较于2023年中期不到5%的水平，呈现出明显的增长趋势。到2028年，将有70%的文件和对象数据部署在一个统一的非结构化数据存储平台上，从2023年初的35%增加到70%。到2027年，至少40%的组织将部署数据存储管理解决方案，用于分类、洞察和优化，从2023年初的15%增加到40%。

2023-09-20 09:03:51 1933 1

原创 2023年非结构化数据管理报告

采用分析、分类和分段数据的工具和实践可以导致细致入微的数据管理策略：低优先级的数据存储在存档存储中，直到需要进行活动使用或可以删除为止，而高优先级的活动数据保留在最昂贵的顶级存储中。这些问题包括从敏感数据泄露到威胁公司知识产权和个人身份信息保护的通用语言学习模型（LLMs），再到伦理、准确性、数据源溯源的担忧，以及派生作品的版权问题，甚至是恶意行为者可能造成的威胁，这些都是企业和社会需要认真面对的问题。当前的AI浪潮迅速塑造了新的工作方式，带来了显著的生产率提升，改变了产品和服务的创造与分发方式。

2023-09-20 09:00:08 2014

原创 hive with tez:无法从链中的任何提供者加载aws凭据

hive with tez:无法从链中的任何提供者加载aws凭据

2023-09-19 11:36:52 2018

原创各种存储性能瓶颈如何分析与优化？

分布式存储系统的核心设计思想是去中心化，去中心化的难点主要在于是主控节点的去中心化，有主控节点的架构比如 HDFS 的架构设计思路是 map-reduce ，化大为小，分而治之，再合并处理，其架构中需要主控节点来协调，只是主控节点的负载都分发到了数据节点，数据节点上则存放着数据副本，每个数据副本又都分布在三个不同的数据节点上，如图 5 所示；随着数字化转型的深入，企业的 IT 系统建设也进一步加快，这一方面带来了数据量的急剧增长，另一方面也提高了数据的访问频率，存储的性能瓶颈的影响也会被进一步放大。

2023-09-19 08:59:41 2026

大模型专题报告：百模渐欲迷人眼，AI应用繁花开

工业革命级的生产力工具。目前，ANI已经广泛应用，AGI处于研发阶段，大模型是实现AGI的重要路径。AI大模型通过预先在海量数据上进行大规模训练，而后能通过微调以适应一系列下游任务的通用人工智能模型。在“大数据+大算力+强算法”的加持下，进一步通过“提示+指令微调+人类反馈”方式，实现一个模型应用在很多不同领域。

2024-03-07

存储专题系列一：新应用发轫，存力升级大势所趋

存储的下游应用过去以手机、PC和服务器为主，以手机、PC为例的消费电子自去年以来需求持续低迷，至今复苏需求仍不明朗，而人工智能和汽车电子作为新兴应用方兴未艾，激发大量增量需求。

2024-03-06

AI智算时代：算力芯片加速升级

智算中心的发展基于最新人工智能理论和领先的人工智能计算架构，当前算法模型的发展趋势以Al大模型为代表，算力技术与算法模型是其中的核心关键，算力技术以Al芯片、Al服务器、Al集群为载体。 GPU主宰算力芯片，Al信创驱动国产算力发展：得益于硬件支持与软件编程、设计方面的优势，CPU+GPU成为了目前应用最广泛的平台。Al分布式计算的市场主要由算力芯片(55-75%)、内存(10-20%)和互联设备(10-20%)三部分组成。由于ChatGPT的爆火，GPU需求明显，英伟达也加大对三星和SK海力士HBM3的订单。2023年10月，SK海力士表示，已经在2023年出售了明年HBM3和HBM3E的所有产量。据Omdia预测，到2025年，HBM市场的总收入将达到25亿美元。

2024-03-06

翻译分布式文件系统：BeeGFS vs GlusterFS.pdf

评估了在广泛变化的条件下Fraunhofer（FhGFS）和Gluster（Glfs）在多个硬件平台上的分布式文件系统技术。虽然我们大多数测试条件的变化使得很难进行直接比较，但我们可以提出一些有用的评论

2023-08-16

2023东北证券-计算机行业AI深度报告，向量数据库：AI时代的Killer+App-230508.pdf

2023-08-15

计算机：CPU生态价值与机遇研究.pdf

新兴领域发展迅猛，CPU未来发展可期。伴随5G、云计算、物联网、大数据、人工智能等创新领域的发展，对算力的需求也大幅增加，CPU作为科技领域的算力支撑后续需求有望迎来发展机遇。具体来看，无论是5G、云计算、大数据相关的科技领域基础设施的搭建，还是5G手机、AR/VR等终端设备的更新更替，还是人工智能、智能驾驶等应用层级的创新，均对算力提出了更高的要求。后续CPU在这些领域的增量应用或将打开CPU更大的市场空间。

2023-08-15

大数据+物联网智慧水务解决方案.pdf

智慧水务通过数采仪、无线网络、水质水压表等在线监测设备实时感知城市供排水系统的运行状态，并采用可视化的方式有机整合水务管理部门与供排水设施，形成“城市水务物联网”，并可将海量水务信息进行及时分析与处理，并做出相应的处理结果辅助决策建议，以更加精细和动态的方式管理水务系统的整个生产、管理和服务流程，从而达到“智慧”的状态。为保证供水工作的科学性提供数据分析，可及时发现管网故障，提高维护效率、降低损失，保障输水、供水质量，达到科学预警，减少成本，提高效率的目的。

2023-08-15

2022中国图计算技术及应用发展研究报告.pdf

近年来图计算学术研究领域发展迅速。近年来图计算学术研究领域发展迅速，从2014年到2021年间，图计算领域论文数量呈现翻倍增长趋势，其中以中美两国学者为首。目前，清华大学、北京大学、中国科学院以及华中科技大学等是国内图计算领域研究的先驱，贡献了中国大多数高被引用图计算论文。图计算产业应用正在大步向前推进。现阶段，图计算领域参与者不仅有互联网/公有云厂商（如蚂蚁、腾讯、AWS、Microsoft Azure等），还有一众垂直图计算企业（如Neo4j、TigerGraph、创邻科技、欧若数网等）、传统数据库厂商（Oracle、IBM等）也已经入局。

2023-08-15

金融行业信创云基础架构方案评估.pdf

IT基础设施是指运行和管理企业IT环境所需服务器、网络、数据存储等组件，为业务系统的运行提供所需的计算、存储、网络资源，因此，IT基础设施是保障业务系统稳定运行、并提升其运行效率的基础。私有云基础设施是部署在企业内部，符合云特性的IT基础设施（IaaS），具备使用简单、可按需投资、敏捷上线、自助使用、计费等“云”特性，同时其部署和运维需要足够简单，从而匹配企业的运维能力。

2023-08-15

计算产业发展简史及趋势

以“信息技术”为特征的第三次工业革命，将世界带入了数字化时代；以“智能技术”为特征的第四次工业革命，目前正在席卷全球，将会把人类社会带入智能化时代。计算已经进入3.0时代。从最早期的大型机、小型机时代，是专用计算，我们称之为计算1.0。到了x86时代，在Intel的带领下，在摩尔定律的驱动下，计算由专用走向了通用，大量数据中心开始出现，也是当前计算产业所处的阶段，我们称之为计算2.0。随着数字化程度的加速发展，世界逐步走向智能化，计算已经不仅仅局限于数据中心，也不仅仅局限于为走向了全栈全场景，我们称之为计算3.0时代，而这个时代的主要特征就是“智能”，所以我们也称之为“智能计算”。

2023-08-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

大模型专题报告：百模渐欲迷人眼，AI应用繁花开

存储专题系列一：新应用发轫，存力升级大势所趋

AI智算时代：算力芯片加速升级

翻译分布式文件系统：BeeGFS vs GlusterFS.pdf

2023东北证券-计算机行业AI深度报告，向量数据库：AI时代的Killer+App-230508.pdf

计算机：CPU生态价值与机遇研究.pdf

大数据+物联网智慧水务解决方案.pdf

2022中国图计算技术及应用发展研究报告.pdf

金融行业信创云基础架构方案评估.pdf

计算产业发展简史及趋势

2021全球加密技术发展趋势研究

人工智能安全隐私和应用案例

存储基础知识培训（共计17页）-DELLEMC

存储基础知识课程（共计57页）

2022 分布式存储市场调研报告 + 分布式存储

企业云数据中心解决方案.pptx

下一代数据存储技术研究报告（2021年）

fio-2.14.tar.bz2

DirectFB-1.7.1

DirectFB_Reference_1_6.7z

Linux中LCD设备驱动

linux LCD编程示例

.vimrc配置文件

空空如也