最奇怪的相机:拍出来的是文字








这种思路我想对于以后的图像领域还是蛮有启发的,在互联网络如此发达的今天,如果把网络充分利用起来,以后对于未知领域的探索不是会更方便,比如以后看到一个东西,发布出去,3-5分钟内就有人给这张图片进行描述,这种感觉还是蛮好!
          



http://img1.guokr.com/gkimage/2n/7k/vw/2n7kvw.png

我们之前都喜欢说,一张照片抵过千言万语,但是世界上总不乏反其道而行之的牛人,这款出自技术爱好者马特·理查森(Matt Richardson)之手的奇特相机,设计初衷就是,如何让20个字来描述一张照片。这款相机目前被称为“白描相机(Descriptive Camera)”,使用一张文字描述的打印字条来取代实际拍摄的图像。

看到这里,你的脑海中蹦出了怎样的技术手段,实现场景到文字描述的转换技术呢?人工智能?机器学习?

其实都不是,这个描述的过程是完全人工实现的。用户手中的这款相机,目前的模型是配备有网络摄像头的,拍摄的过程与普通相机无异,手指轻触拍摄键,也会得到一副用户“看不到的图像”,被直接上传到亚马逊网站提供的“人工外包服务站”——土耳其机器人(Mechanical Turk),只要有人针对照片写下描述性的语言并且提交回送到相机客户端,相机就能够用自带的热敏打印机将其打印出来,如图所示的输出结果。

为了确保结果的有效性,返回相机之前增设了人工筛选过程,最佳描述者会获得金钱上的支付,而最吻合真实场景的描述才会返回到相机用户端。

据统计,整个过程中,结果均会在6分钟内返回,多数情况下可以达到3分钟的反馈速度。

http://img1.guokr.com/gkimage/cx/g0/a2/cxg0a2.png

我们来看看相机拍摄的结果,上图中,相机捕捉到窗外强烈日光下一幢高楼的照片,输出结果为:“这是一幢陈旧老楼的照片,它看起来像是风烛残年摇摇欲坠,急需尽快修葺。(This is a faded picture of a dilapidated building. It seems to be run down and in need of repairs.)”

http://img1.guokr.com/gkimage/9j/6g/qw/9j6gqw.png

如上图,那些黑色方格的不明物体很难辨别,有人提供描述结果为:“这像是一排又老又丑的橱柜,其上还贴着各种老旧商标,残破不堪。橱柜前方有一个台灯与其相连(Looks like a cupboard which is ugly and old having name plates on it with a study lamp attached to it.”

设计者理查森介绍说:“这款相机的实现其实是抛砖引玉的一个探索,在图像的搜索技术迫在眉睫的时候,我想知道如果一款相机能够及时提供‘可供搜索’的描述性语言,会得到怎样的成效。”

这款相机目前还没有明确标价,理查森称,相机的硬件成本约为200美元,但是为其编写代码也花费了很多的时间。同时,在土耳其机器人服务中,每条有效信息为1.25美元。由此估算出来,最终每张照片的成像价格大概与宝丽来相片不相上下。

同时,理查森于今年春季在纽约大学开设了一门叫做“计算型相机(computational cameras)”的课程,他带着这台相机走上课堂,希望能够教学相长,为下一步的设计提供更多想法。

该相机将于5月14日-15日两天在纽约的ITP春季展中展出。

 


 

文章编译自Cnet网站: Descriptive Camera shuns photos for text images

作者: Amanda Kooser






评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值