原创 Linux性能监控及调优资料

Linux的性能监控及调优总结,资料汇总。Linux Performance Profiling and MonitoringLinux Performance ToolsLinux Performance Analysis and ToolsLinux Profiling at Netflix非常全面地介绍Linux系统性能监控,包括CPU、内存、硬盘、网络。官方网站...

2019-12-06 20:24:41

转载 TVM Monthly - September 2021

TVM Monthly - September 2021As discussed by the TVM PPMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that

2021-10-26 11:00:22

转载 TVM Monthly - August 2021

TVM Monthly - August 2021As discussed by the TVM PMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that we

2021-09-02 11:29:47

转载 TVM Monthly - July 2021

TVM Monthly - July 2021As discussed by the TVM PPMC, our goal is to provide a monthly summary of the project so users anddevelopers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that we

2021-09-02 11:28:46

转载 TVM Monthly - June 2021

TVM Monthly - June 2021As discussed by the TVM PMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings-on of the TVM community.Feedback and suggestions are welcomed so that we ca

2021-09-02 11:27:42

转载 TVM Monthly - May 2021

TVM Monthly - May 2021As discussed by the TVM PMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that we can

2021-09-02 11:26:25

转载 TVM Monthly - April 2021

TVM Monthly - April 2021As discussed by the TVM PMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that we c

2021-09-02 11:25:07

转载 TVM Monthly - March 2021

TVM Monthly - March 2021As discussed by the TVM PPMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that we

2021-09-02 11:23:30

转载 TVM Monthly - February 2021

TVM Monthly - February 2021As discussed by the TVM PPMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that

2021-09-02 11:20:58

转载 TVM Monthly - January 2021

TVM Monthly - January 2021As discussed by the TVM PPMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that w

2021-09-02 11:06:03

原创 JPEG 原理详细分析

一 JPEG 概述JPEG 是 Joint Photographic Experts Group 的缩写,即 ISO 和 IEC 联合图像专家组,负责静态图像压缩标准的制定,这个专家组开发的算法就被称为 JPEG 算法,并且已经成为了大家通用的标准,即 JPEG 标准。 JPEG 压缩是有损压缩,但这个损失的部分是人的视觉不容易察觉到的部分,它充分利用了人眼对计算机色彩中的高频信息部分不敏感的特点,来大大节省了需要处理的数据信息。人眼对构成图像的不同频率成分具有不同的敏感度,这个是由人眼的视觉生理特

2020-11-18 16:43:32

转载 Linux虚拟地址空间布局

在多任务操作系统中,每个进程都运行在属于自己的内存沙盘中。这个沙盘就是虚拟地址空间(Virtual Address Space),在32位模式下它是一个4GB的内存地址块。在Linux系统中, 内核进程和用户进程所占的虚拟内存比例是1:3,而Windows系统为2:2(通过设置Large-Address-Aware Executables标志也可为1:3)。这并不意味着内核使用那么多物理内存,仅表示它可支配这部分地址空间,根据需要将其映射到物理内存。 虚拟地址通过页表(Page Table)映射...

2020-06-05 11:45:02

原创 NVIDIA GPU A100 Ampere(安培) 架构深度解析

NVIDIA AMPERE GPU架构深度解析文章目录NVIDIA AMPERE GPU架构深度解析1. NVIDIA A100 Highlights1.1 NVIDIA A100对比Volta有20x性能的性能提升。1.2 NVIDIA A100的5个新特性1.3 AI加速:使用BERT-LARGE进行训练、推理1.4 A100 HPC 加速1.5 GA100 架构图1.6 GA100 SM架构1.7. A100芯片特性总结2. Elastic GPU2.1 A100 NVLINK BANDWIDT

2020-05-28 18:47:17


TheProgrammer's Reference Manuals (PRM)describe the architectural behavior and programming environment of the chipset and graphics devices. The Graphics Controller (GC) contains an extensive set of ...

2020-05-07 16:09:41

转载 第一章  GPU虚拟化发展史

第一章 GPU虚拟化发展史GPU的虚拟化发展历程事实上与公有云市场和云计算应用场景的普及息息相关。如果在10年前谈起云计算,大部分人的反应是“不知所云“。但是随着云计算场景的普及,概念的深入人心,慢慢地大家都对云计算有一个较清晰的概念和实例化的理解。自然,随着应用场景从单一依赖CPU的计算单元的应用扩展到多种体系架构,异构计算场景的应用上来后,对GPU,FPGA,TPU等专业计算芯片也提出了...

2020-05-07 16:07:57

转载 第二章 GPU虚拟化方案之——GPU直通模式

第二章GPU虚拟化方案之——GPU直通模式目前流行的商用GPU虚拟化方案可以分为以下几类:GPU 直通模式,GPU SRIOV 模式,GPU 半虚拟化(mediated passthrough:包括Intel GVT-g和Nvidia GRID vGPU),VMWare的GPU全虚拟化(vSGA)。当然也有尚未成熟处于玩票性质的virtio GPU等等。各种方案的架构如下图,相信大家简单...

2020-05-07 16:06:58

转载 浅谈GPU虚拟化技术(三)GPU SRIOV及vGPU调度


2020-05-07 16:05:29

转载 浅谈GPU虚拟化技术(四)- GPU分片虚拟化


2020-05-07 16:03:41

转载 gpgpu-sim manual

http://gpgpu-sim.org/manual/index.php/Main_PageContents1Introduction 1.1Contributors 1.1.1Contributing Authors to this Manual 1.1.2Contributors to GPGPU-Sim version 3.x 2Microar...

2020-04-08 15:53:39

原创 Python GIL锁问题探究及解决

1. 什么是GIL?GIL即全局解释器(global interpreter lock)。python的每个线程在执行时都需要先获取GIL,保证同一时刻只有一个线程可以执行代码,即同一时刻只有持有GIL锁的线程可以得到执行的机会,使用CPU。这样,在跑python多线程程序时,只有当一个线程获取到全局解释器锁GIL后才能运行,而GIL只有一个,因此即使python应用在多核的情况下也只能发挥...

2019-12-18 10:23:58

转载 x86 CPU中逻辑地址到物理地址映射过程

1段页式内存管理机制在x86 CPU中,采用了段页式内存管理机制,分段和分页模型。 分页(Paging)机制 逻辑地址由页号和偏移量组成。分段(Segment)机制分段允许程序员把存储器看成由多个地址空间或段组成。程序和相关的数据被划分成一组段(segment),不要求所有程序的所有段都有相同长度。和分页一样,分段情况下的逻辑地址由两部分组成:段号和偏移量。...

2019-12-10 21:03:49

转载 YOLOv3通道+层剪枝,参数压缩98%,砍掉48个层,提速2倍

尽管目标检测新算法层出不穷,但在实际工程项目中不少52CV群友还是念着YOLOv3的好。将其部署到边缘设备等时,模型剪枝是非常有必要的,毕竟有原始模型有239M的参数,剪枝后往往也能提速不少。YOLOv3模型剪枝,瘦身80%,提速100%,精度基本不变YOLOv3剪枝再升级!上述剪枝是减少模型通道数,而今天向大家介绍的工程可以实现通道和层的双向剪枝,在oxford hand 数据集ha...

2019-12-10 20:58:18

原创 DDR4内存基础

HP提供的DDR4 For Dummies,非常好的DDR4入门资料。点击下载:DDR4 For Dummies

2019-12-06 21:07:54

原创 Linux Power Management Architecture

Linux Power Management Architecture介绍Linux内核电源管理框架,非常不错的材料。点击下载:Linux Power Management Architecture A review on Linux PM frameworksIntel CPU Power Management OverviewIntel处理器电源管理概述PPT,推荐阅读。...

2019-12-06 21:03:18

原创 硬盘基础知识-Western Digital Drive Basic

文件名:《Western Digital Drive Basic》PPT主要内容:1、硬盘主要部件介绍2、数据记录原理基础3、读写磁头基础4、硬盘盘片Basics5、硬盘磁头Basics6、WD Head Technology下载链接:Western.Digital.Drive.Basic.ppt...

2019-12-06 20:56:49

转载 Linux Kernel and Driver Development Training

Here are the main topics that we cover:Introduction to the Linux kernel Kernel source code Configuring, compiling and booting the kernel Linux kernel modules Memory management and accessing hard...

2019-12-06 20:54:47

原创 Local and Remote Memory: Memory in a Linux NUMA System

全面介绍Linux内核中的NUMA系统,不错的资料。1.Introduction2.A sample NUMA system3.Linux and NUMA memory3.1.Memory Management 1013.2.NUMA memory4.Efficient allocations4.1.Optimal placement: Node local4.2.Multi ...

2019-12-06 20:53:25

原创 What Every Programmer Should Know About Memory

非常经典且全面介绍内存的资料,强烈推荐。内容包括:Commodity Hardware Today CPU Caches Virtual Memory NUMA Support What Programmers Can Do Memory Performance Tools Upcoming Technology查看PDF:What Every Programmer Shou...

2019-12-06 20:50:44

原创 SystemTap使用总结资料汇总

SystemTap使用总结资料汇总System Tap使用指南SystemTap使用技巧【一】SystemTap使用技巧【二】SystemTap使用技巧【三】SystemTap使用技巧【四】SystemTap Tapset Reference Manual...

2019-12-06 20:03:41

原创 SystemTap Tapset Reference Manual

SystemTap Tapset Reference ManualSystemTapHackersCopyright © 2008-2015 Red Hat, Inc. and othersThis documentation is free software; you can redistribute it and/or modify it under the terms ...

2019-12-06 19:57:26

原创 SystemTap使用指南

1.简介 SystemTap是一个Linux非常有用的调试(跟踪/探测)工具,常用于Linux 内核或者应用程序的信息采集,比如:获取一个函数里面运行时的变 量、调用堆栈,甚至可以直接修改变量的值,对诊断性能或功能问题非 常有帮助。SystemTap提供非常简单的命令行接口和很简洁的脚本语 言,以及非常丰富的tapset和例子。 2.何时使用定位(内核)函数位置查看函...

2019-12-06 19:49:34

原创 详细的GStreamer开发教程

详细的GStreamer开发教程文章目录详细的GStreamer开发教程1. 什么是GStreamer?2. GStreamer架构2.1 Media Applications2.2 Core Framework2.3 Plugins3. GStreamer组件3.1 Element创建一个 GstElement3.2 箱柜(bin)元件的状态3.3 衬垫(Pad)元件链接(Pad link)...

2019-11-04 15:16:39

原创 MLPerf Rules总结

文章目录1. MLPerf Inference Rules1.1 Inference Division1.2 Test Scenarios1.3 General rules1.4 Data Sets Rules1.5 Model Rules1.6 总结2. MLPerf Submission Rules (Training and Inference)2.1 Submission Result S...

2019-10-24 15:56:50

原创 使用Gstreamer处理RTSP视频流

文章目录RTSP视频流处理方法1. Gstreamer整体框架1.1 Media Applications1.2 Core Framework1.3 Plugins2. Gstreamer组件2.1 Element2.2 Pad2.3 Bin和Pipeline3. gstreamer tools3.1 gst-inspect-1.03.2 gst-launch-1.04. 参考链接RTSP视频流...

2019-10-24 15:48:49

原创 TensorRT优化和Jetson TX2的性能优化

文章目录1.TensorRT优化原理1) TensorRT目前支持的Layer Fusions2) 使用Batch和混合精度3) kernel auto-tuning2. 影响TensorRT优化的因素3. 如何最大化系统的性能(TX2)1.TensorRT优化原理TensorRT加速DL Inference的能力来源于优化器和运行时,其优化原理包括四个方面:Layer & T...

2019-10-24 15:19:30

原创 TensorRT优化原理和TensorRT Plguin总结

文章目录1. TensorRT优化原理2. TensorRT开发基本流程3. TensorRT Network Definition API4. TensorRT Plugin4.1 实现plugin4.2 编译plugin.so动态库4.3 在TensorRT中加载plugin5. plugin实例1. TensorRT优化原理[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接...

2019-10-24 15:00:18

原创 关于MLPerf的一些调查

文章目录1. MLPerf 介绍2. MLPerf 思路3. MLPerf Training3.1 Training Division3.1.1 Closed Model Division3.1.2 Open Model Division3.2 MLPerf Training Result3.3 MLPerf Training Benchmark3.3.1 image classification...

2019-10-24 14:54:54

原创 Jetson Support Package architecture

Jetson Support Package architectureJetPack中安装的package包括操作系统镜像,库和API,开发人员工具,示例和文档。JetPack 4.2主要新功能包括LTS Kernel 4.9支持,新的Jetson.GPIO Python库,TRT Python API支持以及GStreamer框架的新加速渲染器插件。JetPack包含的软件包如下:...

2019-10-24 14:46:06

原创 NTP时间同步

1. 时区及GMT地球共分为24个时区,按一圈360度计算,每个时区的跨度是15度。国际上约定以0度经线穿过的城市格林威治的时间作为标准时间(Greenwich Mean Time, GMT时间),因此,在格林威治以东的时区,时间递增,而以西的时区时间递减。图1:地球的子午线、经纬度与时区题以北京为例,北京所在地约为东经120度左右,又因为北京在格林威治的东方,因此北京本地时间...

2019-10-24 14:34:56

转载 PNG图片压缩原理解析--屌丝的眼泪


2019-07-19 20:37:50




