PlanckScale1729

计算机视觉 机器学习 数学

DIY 3D全景摄像机

版权声明:原创作品,欢迎转载,但转载请以超链接形式注明文章来源(planckscale.info)、作者信息和本声明,否则将追究法律责任。 目前市面上的VR全景多是二维,没有深度感,若真想拥有身临其境般的体验,深度信息必不可少。诺基亚的OZO,Google的Jump,Facebook开源的Su...

2017-03-02 09:59:06

阅读数:2194

评论数:0

3D全景直播

我们的主页:奇点视觉   全景技术是推动虚拟现实普及化的得力手段,而目前市面上的全景相机主要为二维全景拼接,没有深度感,缺少一个维度,因此很难产生真正的身临其境感。3D全景才是未来虚拟现实内容制作的真正王牌。但目前能制作高质量3D全景内容,甚至能够实时3D直播的产品仍鲜见于视野。   我们...

2016-11-22 11:19:45

阅读数:1019

评论数:0

玩玩三维重建

3D建模的软件N多,而基于照片的快速建模软件并不多,123D Catch算是很赞的一个,不需要任何技术背景便可轻松创建3D模型,但其是个完全的黑匣子,如何从照片一步步重建出3D模型的?VisualSFM和Meshlab两个软件让你了解三维重建的大致过程。

2015-03-16 08:58:40

阅读数:5071

评论数:1

CUDA, 软件抽象的幻影背后 之三

本文原载于我的主页:planckscale.info,转载于此。 版权声明:原创作品,欢迎转载,但转载请以超链接形式注明文章来源(planckscale.info)、作者信息和本声明,否则将追究法律责任。 上一篇中谈到了编程模型中的Block等概念如何映射到硬件上执行,以及CU...

2015-01-23 17:55:13

阅读数:992

评论数:0

CUDA, 软件抽象的幻影背后 之二

上一篇里说到,有两点对CUDA的计算能力影响甚大:数据并行,以及用多线程掩盖延迟。接下来我们要深入到其硬件实现,看一看这些机制是如何运作的。 通常人们经常说某GPU有几百甚至数千的CUDA核心,这很容易让人联想到多核CPU。不过事实上两种“核心”是不一样的概念,GPU的CUDA核心只相当于处理器...

2015-01-21 18:08:03

阅读数:1047

评论数:0

CUDA, 软件抽象的幻影背后

要充分发挥出硬件的极致性能,透过CUDA干净的编程模型,了解背后的底层机制是非常重要的。本文将从硬件层次出发,介绍各种CUDA优化策略.

2015-01-19 18:42:10

阅读数:862

评论数:0

Dronecode Project:无人机的开源平台

两个月前,Linux Foundation 联合 12 家技术公司推出了Dronecode Project,意在整合分散的无人机项目资源,从而创造一个共同共享的无人机开源平台,为无人机开发者们提供操作系统、导航工具、飞行控制等方面的大量开源代码。

2015-01-18 18:14:46

阅读数:1696

评论数:0

用GraphLab Create快速体验深度学习

最近深度学习如日中天,虽然很强大,但其训练起来却是昂贵的,费时费力。最新发布的GraphLab Create 1.1 及1.2使深度学习变得超级简单。它不需要你自己在选择模型和调参上成为专家,就可以玩转神经网络。基于输入数据,neuralnet_classifier.create()函数会自动选择...

2015-01-12 09:31:35

阅读数:1104

评论数:0

2014,虚拟现实大爆炸

本文原载于我的主页:planckscale.info,转载于此。 据 Venturebeat 的报道,《神庙逃亡》结合三星虚拟现实头戴显示器 Gear VR 推出《神庙逃亡 VR》了。游戏中,玩家通过头戴Gear VR查看游戏画面,通过倾斜身体或跳动躲避障碍。 虽然三星...

2015-01-09 19:59:08

阅读数:1088

评论数:1

Levenberg-Marquardt算法

Levenberg-Marquardt算法(下文简称LM算法)通常用于非线性最小二乘法的目标函数极小化。这是一个置信域方法(Trust-Region Method),为了防止步长太大而跳到非预期的局部极小值,这类算法自适应的调整步长。

2015-01-08 20:55:57

阅读数:2962

评论数:0

算法描述与性能优化的解耦——Halide语言 (1)

解耦工作的难度一定程度上取决于要解耦的两个概念是否能够清晰的区分开来。算法描述和性能优化的解耦是不容易的,因为一般说来这两个概念不易区分。但在图像处理这样的领域里,计算具有典型的模式(数据在pipeline上流动,被各个节点依次处理),我们仍然可以把二者很好地解耦。 Halide就是这样一门语言...

2015-01-03 10:15:58

阅读数:3173

评论数:0

3D重建山雨欲来

本文原载于我的主页:planckscale.info,转载于此。 昨天说了3D全景,今天再搜了下,发现了freeD这个东东。 说起来不新鲜,中文网络上这条信息也已经是一年前的了。这就是一个3D重建的典型应用,在体育场上利用多台(比如官网给出的16-28)高清相机在多个位置多个角度采集同一场...

2014-12-22 20:22:48

阅读数:1116

评论数:0

酷技术:SamSung Project Beyond,实时3D全景

本文原载于我的主页:planckscale.info,转载于此。 最近几个月各种实时全景拼接技术雨后春笋般冒了出来,看来一项技术到了瓜熟蒂落的时候,是挡也挡不住。今早无聊搜了下实时全景,还是把不关注技术新闻又懒于做技术推广的老夫吓了一跳。 目前市面上大多数产品跟我们类似,无非是给拼接算...

2014-12-20 20:04:11

阅读数:700

评论数:0

可触摸的全息影像—-让你在VR中有身临其境的体验

本文原载于我的主页:planckscale.info,转载于此。 对我们人类来说,感受是可信赖的。虚拟现实总是飘渺无法捕捉的,然而据New Scientist消息,英国 Bristol 大学的Ben Long和他的同事们利用声波投影实现了“可触摸的全息影像”,将虚拟现实带入到我们的物理世...

2014-12-19 17:59:20

阅读数:1316

评论数:0

图像拼接算法原理 2

本文为作者原创,原载于我们的主页,转载于此。 版权声明:原创作品,欢迎转载,但转载请以超链接形式注明文章来源(planckscale.info)、作者信息和本声明,否则将追究法律责任。 2. 曲面投影 图6. 近时产生越来越大的畸变 通常简单的图像拼接技术,就是如上节所示的基本原理...

2014-12-17 21:16:06

阅读数:2022

评论数:0

多路视频实时全景拼接算法

本文原载于我们的主页,转载于此。 多路视频实时全景拼接算法是我们比较成熟的产品算法,具体Demo可参见我们的Youku主页。 功能 本算法模块对来自多路摄像机的视频图像进行实时的无缝拼接融合,形成一路具有更宽视角的视频。特别的,可以输出360度全景视频,甚至360度*...

2014-12-14 22:49:05

阅读数:8616

评论数:13

一张图胜千言万语:创建图像的自然描述

Google的图像描述系统,先用卷积神经网络处理影像,再用递归神经网络处理文字,从而生成图像的合理文字描述。并且在Pascal、Flickr8k、Flickr30k、SBU等公开的数据集上做了实验,产生的描述非常合理,结果具有鲁棒性。

2014-12-13 11:43:13

阅读数:2256

评论数:0

研究者们公布图像识别软件方面的最新进展

译自: “Researchers Announce Advance in Image-Recognition Software” from The New York Times 两组科学家,各自独立工作,都研发出了能够识别、描述图像和视频内容的人工智能软件,它的精确度比以往任何时候都高,有时甚...

2014-12-12 21:53:45

阅读数:985

评论数:0

共轭梯度(Conjugate Gradient )笔记

本文为作者原创,原载于我们的主页,转载于此。 这是一个关于共轭梯度法的笔记。请大家注意的是,这是个笔记,并不是一个教程,因此少不了跳跃和欠解释的地方。对CG方法了解不多的同学请移步这里。 线性方程组和极小化问题 一个关于对称矩阵的线性方程组等价于求解如下极小值问题:    这很容易说明,...

2014-12-12 21:48:27

阅读数:1043

评论数:0

图像拼接算法原理 1

本系列文章为作者原创,初载于我们的Blog“额外维度”,转载于此。 多路视频实时全景拼接Demo可见我们的youku主页。 0. 引言 图1,2,3.  两张图片的拼接 图像拼接是计算机视觉中一个有趣的领域,它把来自多个不同视角相机的图像变换到同一视角下,无缝拼接成一张宽视...

2014-11-24 15:08:10

阅读数:3771

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭