中兴开发者社区小助理-CSDN博客

原创 AI for Good Webinar:Towards AI-native 6G networks

国际电联AI for Good 2023峰会之探索AI内生的6G网络研讨会将于11月30日16:00-18:00于ITU AI for Good平台线上直播，欢迎扫码报名参加，谢谢！

2023-11-29 09:47:09 377

原创中兴通讯主办的以“探索、启发、共振”为主题的ChatGPT发展与挑战高端论坛于南京顺利举办...

2023年3月16日，由中兴通讯主办的以“探索、启发、共振”为主题的ChatGPT发展与挑战高端论坛于南京顺利举办。

2023-09-05 09:02:53 407

原创一种轻量、无需训练的神经网络结构搜索算法ZenNAS

论文使用Zen-Score搜索出的深度神经网络，在ImageNet数据集上获得最高83.6%的精度，同时模型的推理时间也被约束在特定范围内。

2023-08-10 10:22:47 225

原创算子融合技术演进与Apollo方案浅析

本文将首先带大家回顾算子融合技术的发展历程，并浅析其中颇有代表性的Apollo方案。

2023-08-10 09:26:52 305

原创神经网络模型量化综述（下）

本文主要研究神经网络模型推理的整数量化，其中网络模型在推理时使用整数权重和激活。

2023-08-09 17:28:21 161

原创神经网络模型量化综述（上）

作为通用神经网络模型优化方法之一，模型量化可以减小深度神经网络模型的尺寸大小和模型推理时间，其适用于绝大多数模型和不同的硬件设备。

2023-08-09 16:47:03 518

原创神经结构搜索中的遗传算法

遗传算法是一种基于基因选择的优化算法，它模拟了自然界中种群优胜略汰的进化过程，是一种全局最优的稳定的优化算法。

2023-08-09 16:35:13 349

原创模型优化之知识蒸馏技术简介

Adlik模型优化器后续将把蒸馏融入模型优化，用更小的模型，提供更高的性能。

2023-08-09 16:18:24 166

原创模型优化算法——AutoSlim

AutoSlim是一种one-shot模型优化方法，只要给定网络类型（如MobileNet-v1，ResNet50），给定限制条件（如Flops、latency等），就能自动决定每一层的通道数。

2023-08-09 16:08:10 168

原创面向ASIC设备的编译器框架：TVM or MLIR？

目前TVM和MLIR都没有完全支持定制DSA的设计、上层编译的成熟路线，也就是最终选型的结果对实际工程开发的影响不会很大，都需要开发者/团队深度定制大量代码。...

2023-08-09 15:57:12 658

原创浅谈视觉超大模型

视觉领域的大模型目前仍处于初步摸索阶段，本文主要对现有的视觉超大模型进行简单介绍，并对大模型的应用和未来发展趋势进行分析。

2023-08-09 15:51:24 757

原创基于oneDNN的ResNet50推理速度优化

第二章中介绍的推理加速技术对于ResNet50的推理速度均有很大的提升，并且在以上技术全部实施后，其推理速度与OpenVINO已基本一致。

2023-08-09 15:39:13 477

原创进化神经结构搜索综述

对目前ENAS方向的论文中涉及的进化算法各阶段常见方法进行整理总结。

2023-08-09 15:30:45 273

原创计算图替代——一种DNN框架计算图优化方法

本文主要介绍关于计算图替代的paper，使用不同方式来进行计算图替代优化。

2023-08-09 15:19:08 147

原创 YOLOv5 在 OpenVINO 上的优化实践

研究了YOLOv5模型的知识蒸馏以及在IntelCPU上使用OpenVINO进行部署优化实践。采用知识蒸馏和量化的方法，在不损失精度的条件下实现了该模型在 OpenVINO 上2倍的推理速度提升。...

2023-08-09 15:03:06 190

原创 Tiramisu：一种基于Polyheral的深度学习模型编译器

Tiramisu是一种4层IR结构的，基于Polyhedral模型的编译器，相比基于区间分析的Halide具有更好的领域适用性。

2023-08-09 14:45:39 170

原创 Tenstorrent芯片架构浅谈

本文结合部分公开演讲和相关paper对Tenstorrent芯片架构进行解读。

2023-08-09 11:27:30 336

原创 Stan：一种统计学建模语言

Stan 是一种用于统计建模和高性能统计计算的先进平台。Stan已经在社会、生物和物理科学、工程和商业领域被应用于统计建模、数据分析和预测。

2023-08-09 11:12:45 335

原创 Prophet:一种大规模时间序列预测模型

本文从数学原理出发介绍了facebook开源的Prophet模型，希望能更好的帮助大家理解并使用。参考prophet官方网站：https://facebook.github.io/prophet/

2023-08-09 10:54:16 365

原创实时性能评估框架nn-Meter解读

本文针对 nn-Meter 框架的关键技术点和可扩展注册接口进行了梳理分析，受限于笔者知识水平，文中可能会存在某些理解身上的偏差，欢迎各位大佬进行交流，共同进步。...

2023-07-24 17:02:01 212

原创 MNN推理引擎框架简介

MNN（Mobile Neural Network）一个轻量级的深度神经网络推理引擎，在端侧加载深度神经网络模型进行推理预测。

2023-07-24 16:43:04 1397

原创 MLIR - 一种新的IR表示和编译器框架

MLIR（Multi-Level Intermediate Representation）是一种新型的用于构建可复用和可扩展的编译器的框架。

2023-07-24 16:26:45 220

原创 Halide代码优化思想简述

Halide是一种编程语言，主要在图片处理和矩阵计算时具有方便快捷高性能的特点。它不是一种独立语言，而是基于C++的DSL(Domain Specified Language)，主要应用在算法的底层加...

2023-07-24 15:57:47 249

原创 Facebook data-efficient transformer模型介绍

我们介绍了一种用于图像transformer的模型，由于改进了训练，特别是引入蒸馏策略，因此不需要非常大量的数据进行训练。

2023-07-24 15:47:16 196

原创 BOLT：弥合自动调优和硬件原生性能之间的差距

本文介绍的BOLT基于TVM框架，在GPU平台上进行了进一步的图优化和算子优化，最终将常见的卷积神经网络模型的推理速度提升了2.5倍，搜索时间大大缩减，可以实现20分钟内完成自动搜索调优。...

2023-07-24 15:36:33 222

原创 Ansor: 为深度学习生成高性能张量程序

Ansor是基于分层搜索空间构建的,该空间将高级结构和低级细节解耦。Ansor自动构造计算图的搜索空间,Ansor从空间中采样完整的程序，并对完整的程序进行微调，避免了对不完整程序的粗略估计。...

2023-07-24 15:22:34 213

原创 Adlik在深度学习异构计算上的实践

Adlik首先在架构上支持多类异构硬件和计算引擎，也在FPGA异构计算上完成了一些技术实践，后续将继续进行特定硬件上的计算优化技术的研究，来加速推动AI模型的工程应用。...

2023-07-24 14:53:08 198

原创 Adlik 云原生介绍

Pivotal作为云原生（Cloud Native）应用架构中先驱者和探路者，于2015年提出了云原生应用。

2023-07-24 14:40:07 197

原创 YOLOv4 介绍及其模型优化方法

2020 年 4 月，YOLOv4 在悄无声息中重磅发布，在目标检测领域引起广泛的讨论。

2023-07-24 11:30:03 1608

原创训练后量化(PTQ) 工作流理解

首先介绍了 PTQ 的定义、量化的数学定义即量化公式、量化模拟、range setting，最后介绍了 PTQ 的整体技术流程。

2023-07-24 10:59:02 319

原创通用视觉大模型综述

本文将主要介绍百度文心 UFO 2.0 视觉大模型、华为盘古 CV 以及商汤的 INTERN 大模型。

2023-07-24 10:38:22 807

csdndevpress0035的博客