自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

HanBlogs

写出自己每天的成长历程

  • 博客(49)
  • 资源 (2)
  • 收藏
  • 关注

原创 Linux性能监控及调优资料

Linux的性能监控及调优总结,资料汇总。Linux Performance Profiling and MonitoringLinux Performance ToolsLinux Performance Analysis and ToolsLinux Profiling at Netflix非常全面地介绍Linux系统性能监控,包括CPU、内存、硬盘、网络。官方网站...

2019-12-06 20:24:41 976

转载 TVM Monthly - September 2021

TVM Monthly - September 2021As discussed by the TVM PPMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that

2021-10-26 11:00:22 2465

转载 TVM Monthly - August 2021

TVM Monthly - August 2021As discussed by the TVM PMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that we

2021-09-02 11:29:47 441

转载 TVM Monthly - July 2021

TVM Monthly - July 2021As discussed by the TVM PPMC, our goal is to provide a monthly summary of the project so users anddevelopers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that we

2021-09-02 11:28:46 312

转载 TVM Monthly - June 2021

TVM Monthly - June 2021As discussed by the TVM PMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings-on of the TVM community.Feedback and suggestions are welcomed so that we ca

2021-09-02 11:27:42 320

转载 TVM Monthly - May 2021

TVM Monthly - May 2021As discussed by the TVM PMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that we can

2021-09-02 11:26:25 1352

转载 TVM Monthly - April 2021

TVM Monthly - April 2021As discussed by the TVM PMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that we c

2021-09-02 11:25:07 228

转载 TVM Monthly - March 2021

TVM Monthly - March 2021As discussed by the TVM PPMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that we

2021-09-02 11:23:30 3845

转载 TVM Monthly - February 2021

TVM Monthly - February 2021As discussed by the TVM PPMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that

2021-09-02 11:20:58 143

转载 TVM Monthly - January 2021

TVM Monthly - January 2021As discussed by the TVM PPMC, our goal is to provide a monthly summary of the project so users and developers can get a better understanding of the goings on of the TVM community.Feedback and suggestions are welcomed so that w

2021-09-02 11:06:03 199

原创 JPEG 原理详细分析

一 JPEG 概述JPEG 是 Joint Photographic Experts Group 的缩写,即 ISO 和 IEC 联合图像专家组,负责静态图像压缩标准的制定,这个专家组开发的算法就被称为 JPEG 算法,并且已经成为了大家通用的标准,即 JPEG 标准。 JPEG 压缩是有损压缩,但这个损失的部分是人的视觉不容易察觉到的部分,它充分利用了人眼对计算机色彩中的高频信息部分不敏感的特点,来大大节省了需要处理的数据信息。人眼对构成图像的不同频率成分具有不同的敏感度,这个是由人眼的视觉生理特

2020-11-18 16:43:32 11165 4

转载 Linux虚拟地址空间布局

在多任务操作系统中,每个进程都运行在属于自己的内存沙盘中。这个沙盘就是虚拟地址空间(Virtual Address Space),在32位模式下它是一个4GB的内存地址块。在Linux系统中, 内核进程和用户进程所占的虚拟内存比例是1:3,而Windows系统为2:2(通过设置Large-Address-Aware Executables标志也可为1:3)。这并不意味着内核使用那么多物理内存,仅表示它可支配这部分地址空间,根据需要将其映射到物理内存。 虚拟地址通过页表(Page Table)映射...

2020-06-05 11:45:02 507

原创 NVIDIA GPU A100 Ampere(安培) 架构深度解析

NVIDIA AMPERE GPU架构深度解析文章目录NVIDIA AMPERE GPU架构深度解析1. NVIDIA A100 Highlights1.1 NVIDIA A100对比Volta有20x性能的性能提升。1.2 NVIDIA A100的5个新特性1.3 AI加速:使用BERT-LARGE进行训练、推理1.4 A100 HPC 加速1.5 GA100 架构图1.6 GA100 SM架构1.7. A100芯片特性总结2. Elastic GPU2.1 A100 NVLINK BANDWIDT

2020-05-28 18:47:17 13476 2

转载 HARDWARE SPECIFICATION - PRMS

TheProgrammer's Reference Manuals (PRM)describe the architectural behavior and programming environment of the chipset and graphics devices. The Graphics Controller (GC) contains an extensive set of ...

2020-05-07 16:09:41 607

转载 第一章  GPU虚拟化发展史

第一章 GPU虚拟化发展史GPU的虚拟化发展历程事实上与公有云市场和云计算应用场景的普及息息相关。如果在10年前谈起云计算,大部分人的反应是“不知所云“。但是随着云计算场景的普及,概念的深入人心,慢慢地大家都对云计算有一个较清晰的概念和实例化的理解。自然,随着应用场景从单一依赖CPU的计算单元的应用扩展到多种体系架构,异构计算场景的应用上来后,对GPU,FPGA,TPU等专业计算芯片也提出了...

2020-05-07 16:07:57 1808

转载 第二章 GPU虚拟化方案之——GPU直通模式

第二章GPU虚拟化方案之——GPU直通模式目前流行的商用GPU虚拟化方案可以分为以下几类:GPU 直通模式,GPU SRIOV 模式,GPU 半虚拟化(mediated passthrough:包括Intel GVT-g和Nvidia GRID vGPU),VMWare的GPU全虚拟化(vSGA)。当然也有尚未成熟处于玩票性质的virtio GPU等等。各种方案的架构如下图,相信大家简单...

2020-05-07 16:06:58 15308

转载 浅谈GPU虚拟化技术(三)GPU SRIOV及vGPU调度

本系列文章推送门:阿里云郑晓:浅谈GPU虚拟化技术(第一章)GPU虚拟化发展史阿里云郑晓:浅谈GPU虚拟化技术(第二章)GPU虚拟化方案之——GPU直通模式今天一个小伙伴@我说:“你浅谈一下,没点技术背景的,估计都看不懂…”,醍醐灌顶啊,面向公众的文章不是学术论文,应以普及基本概念为主。所以我决定在接下来的文章力求写的让吃瓜群众能看懂,专业人士能读完也会有很大感触和启迪。至于技术细节,大致...

2020-05-07 16:05:29 12720 1

转载 浅谈GPU虚拟化技术(四)- GPU分片虚拟化

让各位久等了,阿里小二这就开始上新菜:“GPU分片虚拟化”。对于“分片”的理解,相信大家已经不陌生了。此处的分片从两个维度上来定义:其一,是对GPU在时间片段上的划分,与CPU的进程调度类似,一个物理GPU的计算engine在几个vGPU之间共享,而调度时间片一般都在1ms-10ms左右,其二,是对GPU资源的划分,主要是指对GPU显存的划分,以NVIDIA为例,一个物理GPU带有16GB的显...

2020-05-07 16:03:41 10247

转载 gpgpu-sim manual

http://gpgpu-sim.org/manual/index.php/Main_PageContents1Introduction 1.1Contributors 1.1.1Contributing Authors to this Manual 1.1.2Contributors to GPGPU-Sim version 3.x 2Microar...

2020-04-08 15:53:39 2804

原创 Python GIL锁问题探究及解决

1. 什么是GIL?GIL即全局解释器(global interpreter lock)。python的每个线程在执行时都需要先获取GIL,保证同一时刻只有一个线程可以执行代码,即同一时刻只有持有GIL锁的线程可以得到执行的机会,使用CPU。这样,在跑python多线程程序时,只有当一个线程获取到全局解释器锁GIL后才能运行,而GIL只有一个,因此即使python应用在多核的情况下也只能发挥...

2019-12-18 10:23:58 5517 1

转载 x86 CPU中逻辑地址到物理地址映射过程

1段页式内存管理机制在x86 CPU中,采用了段页式内存管理机制,分段和分页模型。 分页(Paging)机制 逻辑地址由页号和偏移量组成。分段(Segment)机制分段允许程序员把存储器看成由多个地址空间或段组成。程序和相关的数据被划分成一组段(segment),不要求所有程序的所有段都有相同长度。和分页一样,分段情况下的逻辑地址由两部分组成:段号和偏移量。...

2019-12-10 21:03:49 2420

转载 YOLOv3通道+层剪枝,参数压缩98%,砍掉48个层,提速2倍

尽管目标检测新算法层出不穷,但在实际工程项目中不少52CV群友还是念着YOLOv3的好。将其部署到边缘设备等时,模型剪枝是非常有必要的,毕竟有原始模型有239M的参数,剪枝后往往也能提速不少。YOLOv3模型剪枝,瘦身80%,提速100%,精度基本不变YOLOv3剪枝再升级!上述剪枝是减少模型通道数,而今天向大家介绍的工程可以实现通道和层的双向剪枝,在oxford hand 数据集ha...

2019-12-10 20:58:18 7050 5

原创 DDR4内存基础

HP提供的DDR4 For Dummies,非常好的DDR4入门资料。点击下载:DDR4 For Dummies

2019-12-06 21:07:54 1478 2

原创 Linux Power Management Architecture

Linux Power Management Architecture介绍Linux内核电源管理框架,非常不错的材料。点击下载:Linux Power Management Architecture A review on Linux PM frameworksIntel CPU Power Management OverviewIntel处理器电源管理概述PPT,推荐阅读。...

2019-12-06 21:03:18 358 1

原创 硬盘基础知识-Western Digital Drive Basic

文件名:《Western Digital Drive Basic》PPT主要内容:1、硬盘主要部件介绍2、数据记录原理基础3、读写磁头基础4、硬盘盘片Basics5、硬盘磁头Basics6、WD Head Technology下载链接:Western.Digital.Drive.Basic.ppt...

2019-12-06 20:56:49 206

转载 Linux Kernel and Driver Development Training

Here are the main topics that we cover:Introduction to the Linux kernel Kernel source code Configuring, compiling and booting the kernel Linux kernel modules Memory management and accessing hard...

2019-12-06 20:54:47 184

原创 Local and Remote Memory: Memory in a Linux NUMA System

全面介绍Linux内核中的NUMA系统,不错的资料。1.Introduction2.A sample NUMA system3.Linux and NUMA memory3.1.Memory Management 1013.2.NUMA memory4.Efficient allocations4.1.Optimal placement: Node local4.2.Multi ...

2019-12-06 20:53:25 274

原创 What Every Programmer Should Know About Memory

非常经典且全面介绍内存的资料,强烈推荐。内容包括:Commodity Hardware Today CPU Caches Virtual Memory NUMA Support What Programmers Can Do Memory Performance Tools Upcoming Technology查看PDF:What Every Programmer Shou...

2019-12-06 20:50:44 249

原创 SystemTap使用总结资料汇总

SystemTap使用总结资料汇总System Tap使用指南SystemTap使用技巧【一】SystemTap使用技巧【二】SystemTap使用技巧【三】SystemTap使用技巧【四】SystemTap Tapset Reference Manual...

2019-12-06 20:03:41 437

原创 SystemTap Tapset Reference Manual

SystemTap Tapset Reference ManualSystemTapHackersCopyright © 2008-2015 Red Hat, Inc. and othersThis documentation is free software; you can redistribute it and/or modify it under the terms ...

2019-12-06 19:57:26 547

原创 SystemTap使用指南

1.简介 SystemTap是一个Linux非常有用的调试(跟踪/探测)工具,常用于Linux 内核或者应用程序的信息采集,比如:获取一个函数里面运行时的变 量、调用堆栈,甚至可以直接修改变量的值,对诊断性能或功能问题非 常有帮助。SystemTap提供非常简单的命令行接口和很简洁的脚本语 言,以及非常丰富的tapset和例子。 2.何时使用定位(内核)函数位置查看函...

2019-12-06 19:49:34 4891

原创 详细的GStreamer开发教程

详细的GStreamer开发教程文章目录详细的GStreamer开发教程1. 什么是GStreamer?2. GStreamer架构2.1 Media Applications2.2 Core Framework2.3 Plugins3. GStreamer组件3.1 Element创建一个 GstElement3.2 箱柜(bin)元件的状态3.3 衬垫(Pad)元件链接(Pad link)...

2019-11-04 15:16:39 36976 6

原创 MLPerf Rules总结

文章目录1. MLPerf Inference Rules1.1 Inference Division1.2 Test Scenarios1.3 General rules1.4 Data Sets Rules1.5 Model Rules1.6 总结2. MLPerf Submission Rules (Training and Inference)2.1 Submission Result S...

2019-10-24 15:56:50 4987

原创 使用Gstreamer处理RTSP视频流

文章目录RTSP视频流处理方法1. Gstreamer整体框架1.1 Media Applications1.2 Core Framework1.3 Plugins2. Gstreamer组件2.1 Element2.2 Pad2.3 Bin和Pipeline3. gstreamer tools3.1 gst-inspect-1.03.2 gst-launch-1.04. 参考链接RTSP视频流...

2019-10-24 15:48:49 20882 11

原创 TensorRT优化和Jetson TX2的性能优化

文章目录1.TensorRT优化原理1) TensorRT目前支持的Layer Fusions2) 使用Batch和混合精度3) kernel auto-tuning2. 影响TensorRT优化的因素3. 如何最大化系统的性能(TX2)1.TensorRT优化原理TensorRT加速DL Inference的能力来源于优化器和运行时,其优化原理包括四个方面:Layer & T...

2019-10-24 15:19:30 3920 1

原创 TensorRT优化原理和TensorRT Plguin总结

文章目录1. TensorRT优化原理2. TensorRT开发基本流程3. TensorRT Network Definition API4. TensorRT Plugin4.1 实现plugin4.2 编译plugin.so动态库4.3 在TensorRT中加载plugin5. plugin实例1. TensorRT优化原理[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接...

2019-10-24 15:00:18 9838 6

原创 关于MLPerf的一些调查

文章目录1. MLPerf 介绍2. MLPerf 思路3. MLPerf Training3.1 Training Division3.1.1 Closed Model Division3.1.2 Open Model Division3.2 MLPerf Training Result3.3 MLPerf Training Benchmark3.3.1 image classification...

2019-10-24 14:54:54 17909 2

原创 Jetson Support Package architecture

Jetson Support Package architectureJetPack中安装的package包括操作系统镜像,库和API,开发人员工具,示例和文档。JetPack 4.2主要新功能包括LTS Kernel 4.9支持,新的Jetson.GPIO Python库,TRT Python API支持以及GStreamer框架的新加速渲染器插件。JetPack包含的软件包如下:...

2019-10-24 14:46:06 405

原创 NTP时间同步

1. 时区及GMT地球共分为24个时区,按一圈360度计算,每个时区的跨度是15度。国际上约定以0度经线穿过的城市格林威治的时间作为标准时间(Greenwich Mean Time, GMT时间),因此,在格林威治以东的时区,时间递增,而以西的时区时间递减。图1:地球的子午线、经纬度与时区题以北京为例,北京所在地约为东经120度左右,又因为北京在格林威治的东方,因此北京本地时间...

2019-10-24 14:34:56 651

转载 PNG图片压缩原理解析--屌丝的眼泪

今天看到一篇文章,本以为是技术硬核,却发现是杯情感鸡汤~,转一下。链接:https://segmentfault.com/a/1190000018557449背景今天凌晨一点,突然有个人加我的qq,一看竟然是十年前被我删掉的初恋。。。。因为之前在qq空间有太多的互动,所以qq推荐好友里面经常推荐我俩互相认识。。。。谜之尴尬同意好友申请以后,仔细看了她这十年间所有的qq动态...

2019-07-19 20:37:50 756 1

鸟哥的私房菜

鸟哥的私房菜

2016-07-28

Thingking in java 4(完美高清版)

Thingking in java 4(完美高清版)

2016-07-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除