自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(159)
  • 收藏
  • 关注

原创 一次RDMA用户态驱动调试的复盘

在达坦科技实习期间,笔者开发了一个RDMA用户态驱动,用于与达坦科技自研的BlueRDMA进行交互。整个驱动分为内核态和用户态两个部分,内核部分做的仅仅是将必要的内存空间暴露给用户态,例如将bar空间上的csr(control status register)寄存器映射到了用户态,主要的操作由用户态驱动执行。用户态驱动申请了4个巨页,并分别指定这几个巨页为与硬件交互的Ringbuf。当用户态驱动需要向硬件发送信息(即描述符)时,只需要在内存上写入若干个描述符,然后修改csr寄存器中队列头指针的值。

2024-09-13 15:35:41 1221

原创 Xline v0.7.0: 一个用于元数据管理的分布式KV存储

现有的分布式KV存储大多采用Raft共识协议,需要两次RTT才能完成一次请求。当部署在单个数据中心时,节点之间的延迟较低,因此不会对性能产生大的影响。但是,当跨数据中心部署时,节点之间的延迟可能是几十或几百毫秒,此时 Raft 协议将成为性能瓶颈。Curp 协议就是为了解决这个问题而设计的。它可以在命令不冲突的情况下减少一个RTT,从而提高性能。因此,[Feature]CURP WAL (Write-Ahead-Log) 实现:我们设计了一个 Write-Ahead-Log 来保存 curp 的日志条目。

2024-08-29 22:34:02 1227

原创 DatenLord前沿技术分享 No.40

达坦科技始终致力于打造高性能 Al+ Cloud 基础设施平台,积极推动AI应用的落地。达坦科技通过软硬件深度融合的方式,提供高性能存储和高性能网络。为 AI 应用提供弹性、便利、经济的基础设施服务,以此满足不同行业客户对 AI+Cloud 的需求。和大家讨论Rust可以为IC design 和verification 带来的优势,以及更广泛的应用场景。将Rust应用于IC design和verification flow中,提高IC design和verification 的生产力和质量。

2024-08-08 19:55:13 458

原创 异步运行时IO问题分析

一般来说,偶尔阻塞Runtime实际上不会对整体性能产生明显影响,例如Tokio实现了work stealing机制,如果一个worker thread被阻塞了,其他的worker threads能够从它的工作队列中偷取任务进行执行,这一定程度上缓解阻塞情况,这对于拥有较多核心的CPU产生的影响是较小的, 而 async-std 中会对阻塞时间较长的任务生成一个新线程,这同样缓解了runtime上偶尔阻塞的问题。persistent_task 是位于关键路径上的一个IO任务,它的优先级应当是最高的。

2024-07-25 22:28:13 934

原创 异步运行时IO问题分析

一般来说,偶尔阻塞Runtime实际上不会对整体性能产生明显影响,例如Tokio实现了work stealing机制,如果一个worker thread被阻塞了,其他的worker threads能够从它的工作队列中偷取任务进行执行,这一定程度上缓解阻塞情况,这对于拥有较多核心的CPU产生的影响是较小的, 而 async-std 中会对阻塞时间较长的任务生成一个新线程,这同样缓解了runtime上偶尔阻塞的问题。persistent_task 是位于关键路径上的一个IO任务,它的优先级应当是最高的。

2024-07-25 22:27:12 769

原创 Xline社区会议Call Up:揭秘Xline 0.7版本更新

为了更全面地向大家介绍Xline的进展,同时促进Xline社区的发展,我们将于召开。

2024-07-25 22:16:03 282

原创 Linux下RDMA驱动程序探索系列-2

由于基本上所有RDMA网卡都是PCIe设备,因此在驱动程序入口执行后,首先要做的是初始化PCIe设备相关的操作,典型的就是调用pci_register_driver向Kernel注册自己所感兴趣的PCIe设备,提供probe回调函数,这样kernel在匹配到驱动所对应的硬件后,就会调用probe函数。这个ib_device_attr类型的结构体是一个拥有40多个字段的结构体,其中主要包含了设备所支持的各种极限参数,例如最大的QP数量、最大的MR数量、最大的PD数量等等这些东西。

2024-07-25 22:02:34 772

原创 规模弹性: 管理谷歌的TPUv4机器学习超级计算机(二)

有趣的是,扭曲环显示出更好的恢复能力,在出现不可用 OCS 的情况下,4x4x8 的性能略有提高。这种平衡在普通环中是不可能实现的。这代表了与我们不同的设计点:与引入分组交换机相比,OCS 简化了 ICI 网络设计,因为它建立了专用物理通道,无需控制共享流量,同时较低的采购价格和待机功率也降低了运营成本[20]。例如,在一个 8x8x8 的环中,将一个数据包从源点(x = 1,y = 0,z = 0)路由到目的地(x = 5,y = 0,z = 0),在 X + 或 X - 方向上可以走 4 跳。

2024-06-22 19:10:07 1022

原创 规模弹性: 管理谷歌的TPUv4机器学习超级计算机

为了帮助解决碎片化问题,Borg Prime 还可以选择抢先处理正在运行的工作负载(例如,将多个子cube工作负载迁移到更少的cube中,或将多cube工作负载迁移到不同的 pod 中,以便容纳非常大的工作负载)。需要注意的是,由于连接的 ICI 和 OCS 具有相同的 {dim,index} 参数,如果一个 OCS 不可用,每个cube都会观察到一个具有相同 {dim,index} 参数的 ICI 链接断开。如果没有 TPUv4 基于 OCS 的可重构性,随着计算资源规模的扩大,作业可用性会迅速下降。

2024-06-13 21:19:49 802

原创 在 GPU 上实现全规模文件系统加速

摘要现代高性能计算和人工智能计算解决方案经常使用 GPU 作为其主要计算能力来源。这就为 GPU 应用程序的存储操作造成了严重的不平衡,因为每一个此类存储操作都必须向 CPU 发出信号并由 CPU 处理。在 GPU4FS 中,我们针对这种不平衡提出了一个彻底的解决方案:将文件系统的实现转移到应用程序中,并在 GPU 上运行完整的文件系统。这需要对从实际存储布局到文件系统接口的整个文件系统栈进行多次更改。此外,这种方法还能将 CPU 从文件系统管理任务中解放出来,从而更有效地利用 CPU。在我们的预极限实现

2024-06-02 13:40:26 842

原创 Xline社区会议Call Up|在 CURP 算法中实现联合共识的安全性

在 Xline 的 CURP 系统中,本文深入探讨了 RIFL作为基础设施,为 RPC 提供 Exactly-Once 语义的实现及相关问题的解决方案。本文讲解了Xline中重构后命令执行流程的新设计,以及我们是如何优化Xline的性能的。Xline的建设需要每一位对此感兴趣且愿意付出的你们的参与,我们期待你们的加入。为了更全面地向大家介绍Xline的进展,同时促进Xline社区的发展,我们将于。

2024-05-24 21:14:58 978

原创 Xline 0.7重构性能分析总述

这个WAL的实现非常简单,整个存储使用多个WAL文件,log的追加的实现就是单个文件的追加,这样所有的log追加操作都是文件的顺序写入,效率很高,并且不存在写放大的现象。更致命的是,tokio的async模型使用的是一个小的固定线程池作为workers,由于Xline中使用的是同步锁,一旦一个worker线程持有这个锁的时间过长,那么就会导致其余的worker线程都进入休眠状态,这些worker线程不仅无法更新这个数据结构,它们也无法执行其他任务,形成了一个锁车队。这样就导致文件写入的高延迟现象。

2024-05-17 17:24:56 641

原创 达坦科技@了你,并邀请你参加2024开源之夏!

同学们通过参与“开源之夏”的活动,在开源项目导师的指导下,不但可以丰富项目实践经验,提升项目开发的技能,而且可以与开源项目的开发者进行深度的交流,以一种最直接的方式了解开源,深入开源,为后续的学业方向提供参考,职业发展积累人脉。本项目需要为开源RDMA网卡blue-rdma编写对应的内核态及用户态驱动程序,从而使之能够支持对N卡或A卡显存进行访问的能力。达坦科技自开源之夏创办首期起每年参与,积极鼓励在校学生积极参与开源软件的开发维护,培养和发掘更多优秀的开发者。的方式,提供高性能存储和高性能网络。

2024-05-10 15:04:27 946

原创 常见设计模式及其Rust实现

定义一个接口来创建几种不同种类的类,其中每个种类可能有若干相互依赖的组件。用户无需指定需要用哪些特定的组件。当需要创建一组相关或依赖的对象时,会使用这种方式。

2024-04-30 13:58:02 1188

原创 Xline中区间树实现小结

需要注意的是, 我们需要同时更新与最后一个节点有关节点的指针, 因为它的位置发生了变化。在petgraph的图实现中, 这个操作可能是很耗时的, 因为一个节点可能会连接多条边, 但是在我们的树用例中, 我们只需要更新这个节点的父亲/左孩子/右孩子总共3个节点, 因此这个操作是 O(1) 的, 这样就非常高效的解决了节点删除的问题。GhostCell 的设计概念是将对数据操作的权限和数据本身分开, 那么对于一种数据, 数据 T 本身是一个类型, 而它的权限同样也是是一个具体的类型, 记为 P_t。

2024-04-23 16:38:42 969

原创 Linux下RDMA驱动程序探索系列-1

为了便于刚接触RDMA的读者阅读本系列文章,首先对RDMA的概念做一个简单的介绍。RDMA是Remote Direct Memory Access的缩写。在介绍RDMA之前,先简单介绍一下更为人所熟知的DMA技术,DMA技术的目的是为了解放CPU的算力,让硬件有能力绕开CPU自己去完成主存(Main Memory)和外设存储器之间的简单而枯燥的数据搬运工作。比较常见的DMA操作是连接在PCIe总线上的设备(如网卡、显卡等)自己主动发起对计算机主存的读写访问操作。

2024-04-15 11:42:41 1022 1

原创 来get属于你的达坦科技令人心动的offer吧!

达坦科技创始团队均来自谷歌、微软、阿里等知名科技公司,团队成员都是一群喜欢并勇于探索前沿技术的同学,大家因为对技术的热爱而聚到一起。2. 负责持续优化系统架构,提供高并发的数据请求分析的处理能力,提高系统的容灾容错能力,保证系统的可运维、高可用性、高可靠性。1. 负责大模型平台后端的开发研发,根据产品和项目计划按时完成功能模块的架构设计、编码、测试的全流程工作。4. 熟悉Linux操作,了解Shell脚本,有Linux下的多线程编程经验,有性能调优经验。

2024-04-05 22:38:45 1007

原创 来get属于你的达坦科技令人心动的offer吧!

达坦科技创始团队均来自谷歌、微软、阿里等知名科技公司,团队成员都是一群喜欢并勇于探索前沿技术的同学,大家因为对技术的热爱而聚到一起。2. 负责持续优化系统架构,提供高并发的数据请求分析的处理能力,提高系统的容灾容错能力,保证系统的可运维、高可用性、高可靠性。1. 负责大模型平台后端的开发研发,根据产品和项目计划按时完成功能模块的架构设计、编码、测试的全流程工作。4. 熟悉Linux操作,了解Shell脚本,有Linux下的多线程编程经验,有性能调优经验。

2024-04-05 22:36:43 265

原创 来get属于你的达坦科技令人心动的offer吧!

达坦科技创始团队均来自谷歌、微软、阿里等知名科技公司,团队成员都是一群喜欢并勇于探索前沿技术的同学,大家因为对技术的热爱而聚到一起。2. 负责持续优化系统架构,提供高并发的数据请求分析的处理能力,提高系统的容灾容错能力,保证系统的可运维、高可用性、高可靠性。1. 负责大模型平台后端的开发研发,根据产品和项目计划按时完成功能模块的架构设计、编码、测试的全流程工作。4. 熟悉Linux操作,了解Shell脚本,有Linux下的多线程编程经验,有性能调优经验。

2024-04-05 22:35:35 540

原创 来get属于你的达坦科技令人心动的offer吧!

达坦科技创始团队均来自谷歌、微软、阿里等知名科技公司,团队成员都是一群喜欢并勇于探索前沿技术的同学,大家因为对技术的热爱而聚到一起。2. 负责持续优化系统架构,提供高并发的数据请求分析的处理能力,提高系统的容灾容错能力,保证系统的可运维、高可用性、高可靠性。1. 负责大模型平台后端的开发研发,根据产品和项目计划按时完成功能模块的架构设计、编码、测试的全流程工作。4. 熟悉Linux操作,了解Shell脚本,有Linux下的多线程编程经验,有性能调优经验。

2024-04-05 22:34:17 473

原创 Xline command 去重机制(二)—— RIFL 实现

在上一篇文章中,我们从 command 去重机制的契机开始,介绍了去重的必要性以及目前 Xline 的去重机制存在的一些问题,同时讲解了 RIFL(Reusable Infrastructure for Linearizability) 的工作原理,并对其进行了一些性能分析。本文将在此基础上进一步更深讲解。

2024-03-29 13:56:39 1033

原创 Karmada 管理有状态应用 Xline 的早期探索与实践

首先,用户需要先在 karmada 上定义好相应的资源来描述跨集群的 Xline 集群的集群拓扑。目前,由于 Karmada 社区对于新的 workload 的实现细节还没有达成共识,因此,在早期的尝试阶段,Xline 采用了两层的 Operator 方式,通过 Karmada Xline Operator 对顶层资源进行解释和拆分,并下发至 member cluster,再由 member cluster 上的 Xline Operator 来对资源进行调谐。这两种模式分别对应了应用的无状态和有状态。

2024-03-22 13:06:50 734

原创 DatenLord前沿技术分享 No.39

达坦科技始终致力于打造高性能 Al+ Cloud 基础设施平台,积极推动AI应用的落地。达坦科技通过软硬件深度融合的方式,提供高性能存储和高性能网络。为 AI 应用提供弹性、便利、经济的基础设施服务,以此满足不同行业客户对 AI+Cloud 的需求。但是在企业中落地大模型挑战很多,包括选择合适的产品形态、建立完善的技术堆栈、建立完善的交付服务体系等。猴子无限在服务大量头部客户的过程中,沉淀了一些早期经验,可供参考。的基础设施服务,以此满足不同行业客户对 AI+Cloud 的需求。,积极推动AI应用的落地。

2024-03-15 15:38:51 416

原创 Membership Change 源码解读

本篇文章我们深入探讨了在分布式系统中如何进行集群成员变更,简单介绍了两种主要的解决方案:Joint Consensus 和单步成员变更,Joint Consensus 通过引入中间状态来保证变更期间不会出现两个 Leader,单步集群变更则是牺牲了一定的功能,通过逐个变更节点来简化实现逻辑。并且对 Xline 目前使用的单步成员变更方案进行了源码级的分析,展示了 Leader 和 Follower 都是如何处理变更的,以及引入集群变更之后,会有哪些新逻辑需要处理。

2024-03-08 15:34:01 832

原创 一封来自 DatenLord 关于GSoC 2024的挑战书

是一项全球性的在线计划,致力于将新的contributor引入开源软件开发领域。GSoC 参与者在导师的指导下,与开源组织合作开展为期 12 周以上的编程项目。您也可以添加小助手微信 DatenLord_Tech,或发邮件至info@datenlord.com 进行咨询。对于报名方式有任何疑问,或者对某一个项目非常感兴趣,并且想要深入了解的同学,欢迎加入。的基础设施服务,以此满足不同行业客户对AI+Cloud 的需求。,积极推动AI应用的落地。1. 您的简历,包括您的过往经历、联系方式等。

2024-03-01 12:28:34 767

原创 招聘不能停!达坦科技2024实习岗位等你来~

2. 负责持续优化系统架构,提供高并发的数据请求分析的处理能力,提高系统的容灾容错能力,保证系统的可运维、高可用性、高可靠性。1. 熟悉基于FPGA的设计流程,熟悉Xilinx的FPGA芯片架构,熟练掌握Xilinx的FPGA开发工具;2. 熟悉Linux内核IO相关功能,有io_uring、ext4、FUSE、eBPF相关开发经验优先;2. 熟悉PCIe、DMA、NVMe、DDR3/4、SerDes等相关接口开发优先;3. 熟悉CXL、PCIe、AXI、ACE、CHI、NVMe等协议接口开发优先;

2024-02-23 12:13:50 698

原创 Xline Jepsen 测试分析

在本篇文章中, 我们主要会介绍Jepsen在测试分布式KV存储Xline中的应用。包括对混沌工程框架Jepsen的介绍, 对分布式系统一致性模型的讨论, 以及对有关测试结果的分析。

2024-02-02 12:46:13 1030

原创 使用SpinalHDL和Cocotb进行敏捷数字芯片设计和验证

摘要:领域特定架构已成为计算机发展的一种趋势。在提供更高效算力的同时,它也给底层硬件的开发带来了更大的挑战。传统的芯片设计和验证技术已越来越无法应对这些新的要求和挑战。在芯片设计上,本文将介绍如何使用SpinalHDL,一种基于Scala的新型硬件描述语言(HDL),或者更准确地说是硬件构造语言,提高硬件设计的效率和质量。对于SpinalHDL,本文还介绍了如何利用Scala的类型系统高效地进行复杂硬件的设计。对于验证,本文将介绍基于Python的验证环境Cocotb,以及如何利用Python简洁高效的语言

2024-01-26 00:22:25 950

原创 Xline v0.6.1: 一个用于元数据管理的分布式KV存储

为了更全面地向大家介绍Xline的进展,同时促进Xline社区的发展,我们将于2024年1月27日北京时间上午10:00召开Xline社区会议。欢迎您届时登陆zoom观看直播

2024-01-19 02:01:36 1244 1

原创 开源Bluespec bsc编译器和可重用示例设计

与其他直接表达架构的HDL一样,BSV/BH是通用的,不针对任何特定的应用领域。在2000年,Lennart Augustsson在一种新的语言BH(Bluespec Haskell)中实现了这些想法,该语言使用Haskell的语法和语义,包括具有多态和类型类的类型系统、单子和高阶函数,从而使其具有静态展开能力和非常强大的类型抽象和类型检查能力[2],[14]。与其他HDL不同的是,BSV/BH中的模块间通信是通过从规则(或从其他方法)中调用方法的概念来表达的,而不是基于输入和输出信号线路来表达的。

2024-01-12 18:42:44 1265

原创 精彩回顾 I DatenLord Hackathon 2023圆满结束!

我认为我的设计最大的亮点是采用了p2p-with-tracker的方式,一方面这种方式可以快速融入到Datenlord的系统中,同时结合分布式KV存储支持数据访问结合了中心化的tracker节点和分布式的p2p传输,以实现高效的数据访问和加速,在系统稳定后基本上都可以从周围在线节点中获取,新增节点可以直接查到周围节点的分片并直接下载,避免直接向S3请求文件。在我目前的研究方向中,也曾经考虑过分布式并行训练的一些问题,此次赛题也给我提供了很大的思考价值,也让我对分布式系统和数据访问加速领域有了更深入的了解。

2024-01-03 20:08:25 820

原创 Xline command 去重机制(一)—— RIFL 介绍

当 Server 收到一个 RPC(client_id, seq_num, first_incomplete) 时,会根据 checkDuplicate 来检查这个 RPC 的状态:1. NEW: 一个新的 RPC,按照正常的逻辑处理请求2. COMPLETED: 一个已经执行完成的 RPC,返回执行完成的记录3. IN_PROGRESS: 一个正在执行的 RPC,返回 IN_PROGRESS 错误4. STALE: 一个已经被 client 确认回收的 RPC,返回 STALE 错误。

2023-12-31 20:28:33 963

原创 Xline v0.6.0: 一个用于元数据管理的分布式KV存储

但是,当跨数据中心部署时,节点之间的延迟可能是几十或几百毫秒,此时 Raft 协议将成为性能瓶颈。Curp 协议就是为了解决这个问题而设计的。它可以在命令不冲突的情况下减少一个 RTT,从而提高性能。当部署在单个数据中心时,节点之间的延迟较低,因此不会对性能产生大的影响。Xline 项目以 Rust 语言写就。:如果在添加成员后立即关闭群集,领导节点可能无法正常关闭,会不断尝试向关闭的新节点发送条目。

2023-12-21 21:21:28 1607

原创 精彩回顾:2023 SpinalHDL 应用前景探索研讨会

达坦科技打造的新一代开源跨云存储平台DatenLord,通过软硬件深度融合的方式打通云间壁垒,实现数据高效跨云访问,建立海量异地、异构数据的统一存储访问机制,为云上应用提供高性能安全存储支持。达坦科技通过软硬件深度融合的方式打通云间壁垒,实现数据高效跨云访问。SpinalHDL是达坦科技在产品中使用的硬件描述语言之一,因此,达坦科技一直热心于推广SpinalHDL在业界的落地应用。两位演讲人专注于SpinalHDL的应用案例,着重分享了具体用SpinalHDL所做的实际的项目或商业应用。

2023-12-21 21:16:56 805

原创 MIT体系结构公开课学习社区2.0版正式上线啦~

所有的设计和升级皆是因为MIT体系结构公开课是不容易的课程,知难而退或者索性躺平都是很正常的反应,我们希望可以通过一些变化鼓励你,按照自己的节奏、按照自己的步幅走,但是,必须“走”,持续地“小步走”,以接近你加入学习社区设定的目标!所以,如何能形成更好的学习社区氛围,如何设计更好的激励制度来鼓励和助力同学们设定目标并严格执行,进而每日积跬步,顺利完成学习各阶段学习任务一直是我们在思考的问题,现在准备工作做好了,因此,我们正式推出。- 提交报名表,报名通过后,给予学号,以便后续追踪同学的学习进展。

2023-12-15 19:42:00 961

原创 倒计时5天:SpinalHDL应用前景探索线上研讨会

达坦科技打造的新一代开源跨云存储平台DatenLord,通过软硬件深度融合的方式打通云间壁垒,实现数据高效跨云访问,建立海量异地、异构数据的统一存储访问机制,为云上应用提供高性能安全存储支持。,它可以作为VHDL或Verilog的替代,Charles Papon 在2014年创建后,伴随着数年来开源硬件设计的蓬勃发展,在多方面显露出优势,譬如:它专注于高效的硬件描述,而不是事件驱动;作为一种基于Scala的DSL,能够借助现有的Scala语言特性和开发工具提供强大、易用、高效的硬件设计能力。

2023-12-06 15:22:38 908

原创 2023 hackathon攻略新鲜出炉!最后一周还不速来报名!

针对这种场景,我们需要对这种数据访问模式进行优化,实现缓存之间的 p2p 传输。达坦科技打造的新一代开源跨云存储平台DatenLord,通过软硬件深度融合的方式打通云间壁垒,实现数据高效跨云访问,建立海量异地、异构数据的统一存储访问机制,为云上应用提供高性能安全存储支持。其中的一种访问 pattern 描述如下:在短时间内,集群中大多数机器对某一个(或者几个)大文件需要同步读取,如果能够在机器之间进行 p2p 的数据传输,存储服务的压力会大大减小,最终提高整个系统的运行效率。

2023-12-06 15:11:41 857

原创 2023年SpinalHDL应用前景探索线上研讨会----征集演讲嘉宾

达坦科技打造的新一代开源跨云存储平台DatenLord,通过软硬件深度融合的方式打通云间壁垒,实现数据高效跨云访问,建立海量异地、异构数据的统一存储访问机制,为云上应用提供高性能安全存储支持。,它可以作为VHDL或Verilog的替代,Charles Papon 在2014年创建后,伴随着数年来开源硬件设计的蓬勃发展,在多方面显露出优势,譬如:它专注于高效的硬件描述,而不是事件驱动;作为一种基于Scala的DSL,能够借助现有的Scala语言特性和开发工具提供强大、易用、高效的硬件设计能力。

2023-11-17 22:19:16 253

原创 叮!您收到了一封来自达坦科技的Hackthon邀请函

在某些极端场景中,集群会对同一个或者几个大文件同时进行读取,此时后端的持久化存储的读取压力会剧增,大大降低整个系统的性能和响应速度。其中的一种访问 pattern 描述如下:在短时间内,集群中大多数机器对某一个(或者几个)大文件需要同步读取,如果能够在机器之间进行 p2p 的数据传输,存储服务的压力会大大减小,最终提高整个系统的运行效率。欲了解更多关于本次Hackathon的赛制、参赛规则、日程安排,以及达坦科技赛题的介绍、相关资源,欢迎预约报名,我们在空中宣讲会等你,不见不散~作品颁奖:12.30。

2023-11-17 22:15:56 227

原创 数据流式编程在硬件设计中的应用

如果以数据流的思想来实现,则如上述图6所示,4个环节之间各自独立运行,各司其职,两个输入通道以及一个输出通道是独立模块,各自可以并行的完成自己的握手,模块与模块之间通过Skid Buf(FIFO)进行解耦。在最终效果部分,直接引用Bluespec原始介绍PPT[2]中的一个页面来进行说明,使用不超过100行代码,仅需要调整4个参数,即可实现在24种不同的计算架构之间进行切换,这24中计算架构在面积和功耗上的差异可以达到10倍以上,用户可以根据自己的使用场景灵活的选择实现方案。硬件天然具有并发的特性。

2023-10-30 21:46:41 144

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除