自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

PlanckScale1729

计算机视觉 机器学习 数学

  • 博客(8)
  • 收藏
  • 关注

原创 CUDA, 软件抽象的幻影背后 之三

本文原载于我的主页:planckscale.info,转载于此。版权声明:原创作品,欢迎转载,但转载请以超链接形式注明文章来源(planckscale.info)、作者信息和本声明,否则将追究法律责任。上一篇中谈到了编程模型中的Block等概念如何映射到硬件上执行,以及CUDA如何用并行来掩盖延迟。这一篇继续剖析SIMT,谈一谈控制流分叉,指令吞吐和线程间通讯机制。虽然

2015-01-23 17:55:13 1299

原创 CUDA, 软件抽象的幻影背后 之二

上一篇里说到,有两点对CUDA的计算能力影响甚大:数据并行,以及用多线程掩盖延迟。接下来我们要深入到其硬件实现,看一看这些机制是如何运作的。通常人们经常说某GPU有几百甚至数千的CUDA核心,这很容易让人联想到多核CPU。不过事实上两种“核心”是不一样的概念,GPU的CUDA核心只相当于处理器中的执行单元,负责执行指令进行运算,并不包含控制单元。可以类比到CPU核心的是流多处理器(Streaming Multiprocessor,简写为SM. Kepler中叫做SMX,Maxwell中叫做SMM),通常

2015-01-21 18:08:03 1323

原创 CUDA, 软件抽象的幻影背后

要充分发挥出硬件的极致性能,透过CUDA干净的编程模型,了解背后的底层机制是非常重要的。本文将从硬件层次出发,介绍各种CUDA优化策略.

2015-01-19 18:42:10 1098

原创 Dronecode Project:无人机的开源平台

两个月前,Linux Foundation 联合 12 家技术公司推出了Dronecode Project,意在整合分散的无人机项目资源,从而创造一个共同共享的无人机开源平台,为无人机开发者们提供操作系统、导航工具、飞行控制等方面的大量开源代码。

2015-01-18 18:14:46 2662

翻译 用GraphLab Create快速体验深度学习

最近深度学习如日中天,虽然很强大,但其训练起来却是昂贵的,费时费力。最新发布的GraphLab Create 1.1 及1.2使深度学习变得超级简单。它不需要你自己在选择模型和调参上成为专家,就可以玩转神经网络。基于输入数据,neuralnet_classifier.create()函数会自动选择一个网络架构并设置合理的参数值。其实并非所有问题都得从头开始去训练一个深度模型,通过简单移除已训练好的DNN的输出层,将传播到输出层的信号作为特征喂给任何一种分类器便可完成我们的一些分类任务。

2015-01-12 09:31:35 1365

原创 2014,虚拟现实大爆炸

本文原载于我的主页:planckscale.info,转载于此。据 Venturebeat 的报道,《神庙逃亡》结合三星虚拟现实头戴显示器 Gear VR 推出《神庙逃亡 VR》了。游戏中,玩家通过头戴Gear VR查看游戏画面,通过倾斜身体或跳动躲避障碍。虽然三星的Gear VR仅售200美元,但遗憾的是,这货需要Galaxy Note 4手机为其提供显示与处理能

2015-01-09 19:59:08 1721 1

原创 Levenberg-Marquardt算法

Levenberg-Marquardt算法(下文简称LM算法)通常用于非线性最小二乘法的目标函数极小化。这是一个置信域方法(Trust-Region Method),为了防止步长太大而跳到非预期的局部极小值,这类算法自适应的调整步长。

2015-01-08 20:55:57 5253

原创 算法描述与性能优化的解耦——Halide语言 (1)

解耦工作的难度一定程度上取决于要解耦的两个概念是否能够清晰的区分开来。算法描述和性能优化的解耦是不容易的,因为一般说来这两个概念不易区分。但在图像处理这样的领域里,计算具有典型的模式(数据在pipeline上流动,被各个节点依次处理),我们仍然可以把二者很好地解耦。Halide就是这样一门语言。Halide是由MIT、Adobe和Stanford等机构合作实现的图像处理语言,它的核心思想即解耦算法和优化,事实也证明它是成功的,在各种实例中它均以几分之一的代码量实现出同等或者数倍于手工C++代码的效能

2015-01-03 10:15:58 6185 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除