自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

荪荪的博客

一枚无价不才的小女子!

  • 博客(3)
  • 资源 (17)
  • 问答 (1)
  • 收藏
  • 关注

原创 并行及分布式框架 -- MPI/NCCL/OPENMP技术

初稿未完成摘要经典并行计算方案介绍。OPENMP技术详细介绍。MPI技术详细介绍。NV集合通信NCCL 技术介绍。MPIMPI(MPI是一个标准,有不同的具体实现,比如MPICH等)是多主机联网协作进行并行计算的工具,当然也可以用于单主机上多核/多CPU的并行计算,不过效率低。它能协调多台主机间的并行计算,因此并行规模上的可伸缩性很强,能在从个人电脑到世界TOP10的超级计算机上使用。缺点是使用进程间通信的方式协调并行计算,这导致并行效率较低、内存开销大、不直观、编程麻烦。OpenMP

2020-12-19 11:50:26 2029 1

原创 实时深度学习的推理加速

作者 Yanchen 毕业于普林斯顿大学机器学习方向,现就职于微软Redmond总部,从事大规模分布式机器学习和企业级AI研发工作。在该篇文章中,作者介绍了实时深度学习的推理加速和持续性训练。引言深度学习变革了许多计算机视觉和自然语言处理(NLP)领域内的任务,它为越来越多的消费者和工业产品提供更强大的智能,并潜在地影响了人们在日常经验和工业实践上的标准流程。从理论上来说,深度学习和其他基于统计机器学习方法的自动化系统十分类似,它们都可以采用两个过程描述。首先,深度神经网络(DNN)模型明确地指向为问题

2020-12-18 06:25:38 928

原创 深度学习训练加速--分布式

一、内部方法网络结构的选择比如 CNN 与 RNN,前者更适合并行架构优化算法的改进:动量、自适应学习率减少参数规模比如使用 GRU 代替 LSTM参数初始化Batch Normalizationmini-batch 的调整二、外部方法GPU 加速数据并行模型并行混合数据并行与模型并行CPU 集群GPU 集群如下图所示(如借用的)这里重点讲解外部加速方法,旨在阐述训练大规模深度学习模型时的分布式计算思想:具体来讲:首先,介绍了分布式计算的基本概念,以及分布式计

2020-12-18 06:24:35 792

TensorRT-CenterNet.zip

TensorRT centerNet 检测部署资源

2021-12-14

PersonTrack.zip

yolo人体检查,deepsort实现人员跟踪

2021-12-14

pytorch_arm_aarch64_builds-master.zip

aarch64 wheels for pytorch

2021-12-14

yolov3_demo.zip

在TB-RK3399Pro运行yolov3实现目标检测的示例代码,大家可以在这上面继续优化,实现更好的效果。代码中有python,C

2020-10-20

python全栈(一)网络通信与服务器之http协议、http服务器-并发服务器的配套html补充

python全栈(一)网络通信与服务器之http协议、http服务器-并发服务器的配套html补充,仅供学习使用,对应的博客链接https://blog.csdn.net/SMF0504/article/details/109045505

2020-10-14

python全栈(一)网络通信与服务器之http协议、http服务器-并发服务器的配套html

python全栈(一)网络通信与服务器之http协议、http服务器-并发服务器的配套html,仅供学习使用,对应的博客链接https://blog.csdn.net/SMF0504/article/details/109045505

2020-10-14

pytorch_1.5.1_cpu.rar

深度学习框架,cpu版本的pytorch,在python3.6+ pytorch1.5.1 cpu_torcvision0.6.1

2020-07-30

pytorch1.2.0.rar

深度学习框架,gpu版本的pytorch,在python3.5+ cuda10.0 + cudnn7.6+pytorch1.2.0 gpu_torcvision0.4.0

2020-07-30

精简的opencv4的库libopencv_world.so

用于o海思35XX系列开发板,只要安装的交叉编译器arm-himix200-linux,都适用,这是精简之后的opencv4的库,将其放置到开发板lib目录下,省去了添加opencv路径的麻烦,前提条件是你的开发板的存储空间比较大

2020-04-04

opencv4交叉编译好的库.rar

用于o海思35XX系列开发板,只要安装的交叉编译器arm-himix200-linux,都适用,注意移到开发板/mnt/mtd目录下,并注意用软连接的方式连接到开发板lib下的方式添加opencv路径

2020-04-04

VMware-workstation-full-15.5.0-安装软件.rar

VMware-workstation-full-15.5.0-安装软件,虚拟机(Virtual Machine)指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。虚拟系统通过生成现有操作系统的全新虚拟镜像,它具有真实windows系统完全一样的功能,进入虚拟系统后,所有操作都是在这个全新的独立的虚拟系统里面进行,可以独立安装运行软件,保存数据,拥有自己的独立桌面,不会对真正的系统产生任何影响 ,而且具有能够在现有系统与虚拟镜像之间灵活切换的一类操作系统。

2020-03-24

Linux Makefile工程实战教程.zip

该教程介绍Linux环境下开发软件编译Makefile的基础知识、项目构建、一步一步从零开始写一个模拟MP3项目的Makefile。

2020-01-19

一学就会——vim高级教程为c、c++量身定制vim.ppt

vim的高级教程,也是《嵌入式linux应用软件工程师》的提高教程。 专门为c/c++语言量身定制了vim,安装各种各样的插件,提高编写代码的效率。 安装插件只需要执行一个命令即可,简单方便,快速上升。 插件装完后,熟悉各种各样插件的用法即可——包你一学就会。 注意:该教程仅适用于c/c++开发人员,不适合其他语言的

2020-01-13

C语言入门--必须基础17讲-认识C语言.zip

适合没有基础的人群学习C语言,简单的入门教程。帮助小白理解什么是开发,什么是编程。做的很简单,很多细节没有详细讲解,不适合用来深入研究。学了这个,你能理解什么是编程,什么是C语言。

2020-01-13

高质量C++/C编程指南

C\C++编程指南

2017-03-20

模式识别与机器学习

模式识别与机器学习,由马春鹏翻译英文原著而来,这本书已经绝版了,也是经典之书,目前没有中文纸质的,只有电子书。

2016-02-18

OpenCV人门教程

Opencv人门教程,视觉图像处理工具,视觉算法库,编程指导,零基础易快速进入状态

2016-02-18

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除