算法
文章平均质量分 88
普通网友
这个作者很懒,什么都没留下…
展开
-
短视频技术与市场动态
短视频技术与市场动态原创 2022-05-09 05:39:28 · 862 阅读 · 0 评论 -
计算机未解决难题
计算机未解决难题在现实生活中,很多难题的解决方案都用到了计算机科学的基础理论。例如, Git 分布式版本控制系统建立在图论、数据结构和密码学等之上。然而,每个理论中也存在非常具有挑战性的问题。伟大的计算机科学家们已经解决了很多理论难题。例如,快速排序法和合并排序法都是有效的大型列表排序算法。然而,就像其他研究领域一样,计算机科学也有自己的神秘之处。许多计算机科学家都在努力寻找这些谜团的解决方案。但是,计算机科学界仍然还有一些至今仍未解决的难题,因为科学家无法证明答案是正确的,而且大多数其他的计算机科学家也原创 2022-04-06 06:22:32 · 1480 阅读 · 0 评论 -
部署可扩展的目标检测管道:推理过程(下)
部署可扩展的目标检测管道:推理过程(下)融合感兴趣的目标可以被遮挡。有时只能看到目标的一小部分(少至几个像素)。• 图19.车辆和交通信号灯被遮挡。• 图20:阻塞了总线。• 图21:左侧的人被遮挡了。像YOLOv3这样的基于CNN的目标检测方法有一个缺点,即要求特征图生成对目标遮挡具有鲁棒性。而且,仅引发许多特征图并不能提高性能。已知诸如空间金字塔池之类的方法可以通过改进常规YOLOv3算法来更好地处理遮挡。照明条件照明的影响在像素级别上非常明显。• 图22. 白天。原创 2020-12-28 05:50:48 · 325 阅读 · 0 评论 -
为x86 CPU自动调度神经网络
为x86 CPU自动调度神经网络对特定设备和工作负载进行自动调试对于获得最佳性能至关重要。这是有关如何使用自动调度器为x86 CPU调试整个神经网络的文档。为了自动调试神经网络,将网络划分为小的子图,并对其进行独立调试。每个子图被视为一个搜索任务。任务调度程序可以对时间进行分片,并为这些任务动态分配时间资源。任务调度程序可以预测每个任务对端到端执行时间的影响,并优先调度可以最大程度地减少执行时间的任务。对于每个子图,使用compute声明tvm/python/topi获取张量表达式形式的计算DAG。然原创 2020-12-24 06:19:01 · 424 阅读 · 0 评论 -
TVM Reduction降低算力
TVM Reduction降低算力这是有关如何降低算力TVM的介绍材料。像sum / max / min这样的关联约简运算符是线性代数运算的典型构造块。本文将演示如何降低TVM算力。from future import absolute_import, print_functionimport tvmimport tvm.testingfrom tvm import teimport numpy as np描述行数假设要计算行总数作为示例。用numpy语义可以写成B = numpy.sum原创 2020-12-23 09:03:49 · 531 阅读 · 0 评论 -
TinyML-TVM是如何驯服Tiny的(下)
TinyML-TVM是如何驯服Tiny的(下)Lazy Execution实际上,随着通信开销开始占主导地位,一旦用户请求,就执行算子的开销变得非常昂贵。可以通过延迟评估直到用户需要调用的结果来提高系统的吞吐量。从实现的角度来看,现在需要在主机端积累函数调用元数据,然后再将其刷新到设备,而不是急于序列化参数元数据和UTVMTask数据。设备runtime也需要一些改变:(1)现在必须有一个UTVMTask的全局数组(2)需要循环执行每个任务。带MicroTVM的AutoTVM到目前为止,所描述原创 2020-12-16 06:03:35 · 348 阅读 · 0 评论 -
x86 cpu卷积网络的自动调谐
x86 cpu卷积网络的自动调谐这是一个关于如何为x86cpu调整卷积神经网络的文档。本文不会在Windows或最新版本的macOS上运行。要让它运行,需要将主体包装在if name == “main”: 块中。import osimport numpy as npimport tvmfrom tvm import relay, autotvmfrom tvm.relay import testingfrom tvm.autotvm.tuner import XGBTuner, GATun原创 2020-12-14 08:19:37 · 528 阅读 · 0 评论 -
NVIDIA GPU卷积网络的自动调谐
NVIDIA GPU卷积网络的自动调谐针对特定设备和工作负载的自动调整对于获得最佳性能至关重要。这是关于如何为NVIDIA GPU调整整个卷积网络。NVIDIA GPU在TVM中的操作实现是以模板形式编写的。模板有许多可调旋钮(平铺系数、展开等)。将调整神经网络中的所有卷积和深度卷积算子。在调优之后,生成一个日志文件,其中存储了所有所需操作符的最佳旋钮值。当TVM编译器编译这些运算符时,它将查询此日志文件以获得最佳的旋钮值。还发布了一些NVIDIA GPU的预调参数。可以去NVIDIA GPU基准测试原创 2020-12-14 08:01:57 · 595 阅读 · 0 评论 -
编写可调模板并使用Auto-tuner自动调谐器
编写可调模板并使用Auto-tuner自动调谐器本文介绍在TVM自动调谐模块。自动调谐有两个步骤。第一步是定义搜索空间。第二步是运行一个搜索算法来探索这个空间。可以学习如何在TVM中执行这两个步骤。以矩阵乘法为例说明了整个工作流程。本文不会在Windows或最新版本的macOS上运行。要让它运行,需要将主体包装在if name == “main”:块中。安装依赖项要在TVM中使用autotvm包,需要安装一些额外的依赖项。此步骤(安装xgboost)可以跳过,它不需要xgboost(如果使用pyt原创 2020-12-14 07:10:45 · 638 阅读 · 0 评论 -
用Auto-TensorCore代码生成优化matmul
用Auto-TensorCore代码生成优化matmul将演示如何使用TVM Auto TensorCore CodeGen在Volta/Turing GPU上编写高性能matmul调度。这是一个透明的解决方案,可以生成大多数在ir过程中完成的转换的tensorcore内核。用户还可以编写带有tensorize的调度来生成TensorCore代码。两个解决方案使用相同的tensorcore内部函数。有关详细信息,请参阅如何使用TensorCores优化卷积资料。 准备和算法支持原创 2020-12-14 06:38:47 · 569 阅读 · 1 评论 -
如何使用Nsight Compute?
如何使用Nsight_Compute?原创 2020-10-20 14:09:13 · 1348 阅读 · 1 评论 -
黎曼曲面Riemann Surface
黎曼曲面Riemann SurfaceA Riemann surface is a surface-like configuration that covers the complex plane with several, and in general infinitely many, “sheets.” These sheets can have very complicated structures and interconnections (Knopp 1996,pp. 98-99). Riem原创 2020-07-16 15:57:45 · 1897 阅读 · 1 评论 -
几何和线性代数算子
几何和线性代数算子Geometry and Linear Algebraic Operations了解了线性代数的基础知识,并了解了如何使用来表示转换数据的常见操作。线性代数是进行深度学习和更广泛的机器学习的主要数学支柱之一。虽然包含了足够多的机制来交流现代深度学习模型的机制,但是这个主题还有很多内容。将更深入地介绍线性代数运算的一些几何解释,并介绍一些基本概念,包括特征值和特征向量。Geometry of Vectors首先,需要讨论向量的两种常见的几何解释,即空间中的点或方向。基本上,向量是原创 2020-07-03 12:44:45 · 471 阅读 · 0 评论 -
CUDA C 纹理提取Texture Fetching
CUDA C 纹理提取Texture Fetching一.参数曲面的纹理使用纹理指定参数曲面属性。二.CUDA C 纹理获取开发用于计算纹理函数,根据纹理引用的各种属性返回的值的公式(请参见纹理和曲面内存)。绑定到纹理引用的纹理表示为Ntexels for a one-dimensional texture,N x Mtexels for a two-dimensional texture,N x M x Ltexels for a three-dimensional textur原创 2020-06-12 14:38:44 · 325 阅读 · 0 评论 -
CVPR2020论文解析:视觉算法加速
CVPR2020论文解析:视觉算法加速GPU-Accelerated Mobile Multi-view StyleTransfer论文链接:https://arxiv.org/pdf/2003.00706.pdf摘要据估计,2018年售出的智能手机中,有60%配备了多个后置摄像头,从而实现了3D照片等多种支持3D的应用。3D照片平台(Facebook 3D Photo、Holopix...原创 2020-03-24 12:47:14 · 508 阅读 · 0 评论 -
ADAS感知算法观察
ADAS感知算法观察如果把一台ADAS车辆比作一个人的话,那么激光雷达、毫米波雷达、摄像头、IMU及GPS等等部件就相当于人的眼睛、鼻子、耳朵、触觉及第六感等器官或系统。环境感知作为无人驾驶的第一环节,处于车辆与外界环境信息交互的关键位置,其关键在于使无人驾驶车辆更好地模拟人类驾驶员的感知能力,从而理解自身和周边的驾驶态势。激光雷达、毫米波雷达、超声波雷达、定位导航系统、视觉系统等为无人驾驶...原创 2020-03-15 19:29:17 · 2262 阅读 · 0 评论 -
目标检测算法进展大盘点
目标检测算法进展大盘点一.早期的目标检测盘点将从多个方面回顾对象检测的历史,包括里程碑检测器、目标检测数据集、指标和关键技术的发展。在过去的10年中,人们普遍认为,目标检测的发展大致经历了两个历史时期:“ 传统的目标检测时期 ” ( 2014年以前 ) 和 “ 基于深度学习的检测时期 ” ( 2014年以后 ),如下图所示。01传统检测器如果把今天的物体检测看作是深度学习力量下的一种技术...原创 2020-03-13 15:19:51 · 2666 阅读 · 0 评论 -
三维目标检测算法原理
三维目标检测算法原理输入输出接口Input:(1)图像视频分辨率(整型int)(2)图像视频格式(RGB,YUV,MP4等)(3)左右两边的车道线位置信息摄像头标定参数(中心位置(x,y)和5个畸变系数(2径向,2切向,1棱向),浮点型float)(4)摄像头初始化参数(摄像头初始位置和三个坐标方向的旋转角度,车辆宽度高度车速等等,浮点型float)Output:(1)Band...原创 2020-03-11 20:04:26 · 1151 阅读 · 0 评论 -
自动驾驶架构与实现路径
自动驾驶架构与实现路径1.自动驾驶可能的架构图1. 自动驾驶可能的架构2.自动驾驶实现路径表1. 自动驾驶实现路径原创 2020-03-11 18:55:27 · 300 阅读 · 0 评论