自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 资源 (2)
  • 收藏
  • 关注

原创 Scala+Chisel教程 | Chisel Bootcamp中文

这是一个很好的 Scala+Chisel 的入门教程,不需要本地配置环境,可以方便的在线运行。项目介绍了 Scala 基础语法(case class、trait、伴生对象)、函数式编程、Chisel 编程和测试,虽然不是很全,但很适合用来上手。,一个基于RISC-V向量扩展的开源的GPGPU软硬件实现。即点即用的 playground,不需要配置环境在。fork的翻译版链接在。使用chisel撰写。

2024-06-23 15:14:21 199

原创 WSL网络解决方案

此时可以用wget测试。

2023-12-06 13:13:00 423

原创 GPU simulator调研

GPU simulator

2022-10-11 11:04:32 1897

原创 【文献阅读】gem5-gpu: A Heterogeneous CPU-GPU Simulator

gem5-gpu是一个新的模拟器,为紧密集成的CPU-GPU系统建模。它建立在gem5(一个模块化的全系统CPU模拟器)和GPGPU-Sim(一个详细的GPGPU模拟器)的基础上。gem5-gpu通过Ruby路由大多数内存访问,Ruby是gem5中一个高度可配置的内存系统。通过这样做,它能够模拟许多系统配置,从具有连贯缓存和跨越CPU和GPU的单一虚拟地址空间的系统到保持独立的GPU和CPU物理地址空间的系统。应用程序可以启动非阻塞式内核,允许CPU和GPU同时执行。

2022-10-10 23:42:35 2095 1

原创 【文献阅读】Accel-Sim: An Extensible Simulation Framework for Validated GPU Modeling

Accel-Sim: An Extensible Simulation Framework for Validated GPU Modeling

2022-10-09 19:43:47 748

原创 【文献阅读】[非线性模块]NPE: An FPGA-based Overlay Processor for Natural Language

近年来,基于Transformer的模型已经显示出自然语言处理(NLP)的最新成果。特别是,BERT语言模型的引入带来了诸如问答和自然语言推理等任务的突破,推进了允许人类与嵌入式设备自然交互的应用程序。基于FPGA的overlayprocessors已被证明是边缘图像和视频处理应用的有效解决方案,这些应用主要依赖于低精度线性矩阵运算。相比之下,基于Transformer的NLP技术采用了各种具有更高频率的更高精度的非线性运算。KeyWords。...

2022-07-18 11:21:33 2513

原创 【文献阅读】An Investigation on Hardware-Aware Vision Transformer Scaling

VisionTransformer(ViT)在各种计算机视觉任务中表现出可观的性能,最近引起了很多研究关注。最近的许多工作都集中在提出新的架构以改进ViT并将其部署到实际应用程序中。然而,很少有人努力分析和理解ViT的架构设计空间及其对不同设备的硬件成本的影响。在这项工作中,通过简单地缩放ViT的深度、宽度、输入大小和其他基本配置,我们表明,与大多数最新的ViT变体相比,没有花里胡哨的ascaledvanillaViTmodel可以实现相当或更高的精度效率权衡。...

2022-07-17 20:28:53 324

原创 【文献阅读】HAT: Hardware-Aware Transformers for Efficient Natural Language Processing

题目HAT,时间2020,研究机构MIT 寒松团队

2022-07-17 20:04:05 122

原创 【文献阅读】MCUNet: Tiny Deep Learning on IoT Devices

一种高效网络架构搜索(TinyNAS)与轻量推理引擎(TinyEngine)联合设计的方案。它可以使得ImageNet级别的推理在微处理器上进行运行。

2022-07-16 01:38:29 462

原创 【文献阅读】VAQF: Fully Automatic Software-Hardware Co-Design Framework for Low-Bit Vision Transformer

VAQF : 低比特Vision Transformer的全自动软硬件协同设计框架

2022-07-14 20:25:03 926 2

原创 【文献阅读】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

Swin Transformer

2022-07-14 12:29:47 890

翻译 【翻译】Transformers in Computer Vision

比较了CNN和ViT在CV中的情况。

2022-07-11 12:06:58 272

原创 【文献阅读】isl: An Integer Set Library for the Polyhedral Model

题目:isl: An Integer Set Library for the Polyhedral Model时间:2010会议:ICMS (International Congress on Mathematical Software)研究机构:Department of Computer Science, Katholieke Universiteit Leuven, Belgium and Team ALCHEMY, INRIA Saclay, France...

2022-07-10 18:45:18 264

原创 【文献阅读】Multi-state MRAM cells for hardware neuromorphic computing

题目:Multi-state MRAM cells for hardware neuromorphic computing时间:2021会议/期刊:研究机构:AGH University of Science and Technology

2022-07-10 18:43:46 377

原创 【文献阅读】Small-Footprint Keyword Spotting with Multi-Scale Temporal Convolution

题目:Small-Footprint Keyword Spotting with Multi-Scale Temporal Convolution时间:2020会议/期刊:INTERSPEECH研究机构:CAS Key Laboratory of Wireless-Optical Communications, 中科大

2022-07-10 10:02:18 395

原创 【文献阅读】Counting Integer Points in Parametric Polytopes Using Barvinok‘s Rational Functions

题目:Counting Integer Points in Parametric Polytopes Using Barvinok’s Rational Functions时间:2007会议/期刊:Algorithmica

2022-06-20 18:32:39 107

原创 【文献阅读】TENET: A Framework for Modeling Tensor Dataflow Based on Relation-centric Notation

TENET: A Framework for Modeling Tensor Dataflow Based on Relation-centric Notation

2022-06-19 16:44:39 916

ce6.4安装版中文版

cheat engine6.4,中文版,需要安装

2015-08-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除