人工智能正在跨越“恐怖谷”，未来或将善恶共存

最新推荐文章于 2024-06-14 20:43:21 发布

weixin_34102807

最新推荐文章于 2024-06-14 20:43:21 发布

阅读量166

点赞数

文章标签：人工智能 photoshop

原文链接：http://www.cnblogs.com/guanghuan33/p/8116317.html

版权

一场革命正在进行，可从条纹的变化里管中窥豹。

今年，来自伯克利的研究人员发布了两个视频。第一个视频里是一匹马在围栏里小跑；而在第二个视频中，这匹小跑中的马却渐渐变成了斑马。当然，这只是围栏的条纹恰好投射在马的身上而让它看起来像是斑马一样，并非是说这匹马真的变成了斑马。

把马变成斑马不止是个漂亮的噱头，还是机器学习算法重构现实的一个标志。例如，人们可以用图片编辑软件把图片里的黑熊变成熊猫，苹果变成橘子，猫变成狗加拿大新创公司琴鸟（Lyrebird）的机器学习专家可以从一分钟的人声样本中合成出可信的音频片段。Adobe公司推出的Sensei人工智能平台，把机器学习融入到视频、照片和音频编辑工具中去。这些项目有一个共同点：它们所制作出的场景和声音都非常真实。

这种技术将把我们推向新的创造领域，不止能扩大艺术家的创造力，还能使业余爱好者具备专业人员的知识水平。我们将重新定义创造力，把机器的产物也纳入进来。但是有利有弊，别有用心者会利用这种技术制造假新闻。到时候，人们会担心各种图像、文本、音频等内容是否被篡改过。此外还有一个问题，人类在专辑制作或者电视剧制作里扮演了什么角色？

一个充斥了人工智能产物的世界，可以很好，也可以很坏，与我们近在咫尺。

目前，有两种方法来制作拟真的音频或视频。一是利用摄像头和麦克风实时拍摄，比如对登陆月球的记录。二是利用人力复刻，这经常需要很高的代价。比如，如果登陆月球是个骗局的话，那么，电影制作团队将必须筹备阿姆斯特朗迈去月球的“第一步”。现在，机器学习算法提供了第三种选择，它可以让任何有基础的人，利用算法混合素材制造出无限可能的“真实”。

起初，深度学习生成的内容并不适合照相现实主义。2015年Google发布的“深度梦想（Deep Dreams）”利用了深度学习来形成怪诞的画作。2016年，一款名为“Prisma”的照片编辑程序通过深度学习为艺术照片添加滤镜，例如，它能使普通快照具有蒙德里安风格。这种技术就是风格转换，即采取某一图像的风格（如蒙克的《尖叫》），并将之应用于其他图像上使其具备相应风格的技术手段。

现在，样式转换的算法在逐渐完善，图像处理也更为精细，却也标志着“恐怖谷”的终结。这里说的“恐怖谷”是一种心理现象，指人们会对一个较高水平拟真的机器人感到恐惧，但如果这种拟真程度再次提高，人们的好感却会大幅度回升。如今，已经出现了跨越“恐怖谷”的算法了。康奈尔大学的卡维塔·巴拉（Kavita Bala）实验室正在进行相关研究，其深度学习可以将一张照片的风格（如一个闪烁的星空）注入到其他的大都市的快照中，且能以假乱真。此外，卡维塔·巴拉还在此基础上结合了人工智能创立了Grokstyle公司。如果你看中了朋友家沙发上的抱枕或者杂志上的某个东西，可以拍下来上传到Grokstyle公司的网站上，这家公司的算法就可以识别出图像中的家居物品，并列举出物品价格以及相似物品等。

卡维塔·巴拉说：“我喜欢这些技术，因为设计和时尚能就此变得大众起来。我是一名技术专家，我虽然喜欢美丽与时尚，却不能自己创造出来。但现在有了这种技术，不止我能玩美，人人都可以。”

十几年来，机器学习已经成为Adobe公司创意产品的一部分，但直到最近因为AI的兴起，才有了变革性的进展。在十月份，Sensei的工程师展示了一套名为“Adobe Cloak”的视频编辑工具，该工具让人们可以轻松实现无缝剪辑，无缝剪辑对专业的剪辑师来讲也是极为复杂的工作。Adobe还推出了一个名为“Project Puppetron”的画风迁移软件，它可将所需的艺术风格事实应用到视频中。例如，一个人如果经过这个软件处理，可以让自己在视频中显示成一个雕像或者是个漫画风格的人物。高级首席科学家乔恩·勃兰特（Jon Brandt）说：“人们可以在任何摄像头前进行演出，并将其实时转换成动画。”

相比以往的计算机视觉方法而言，机器学习更好地识别脸部的细微差异，使这些项目成为可能。Sensei让艺术家能更好地利用概念进行创造，不用在处理原材料上浪费时间。“Photoshop在处理像素方面非常出色，但是人们要的是像素组合之后所代表的内容。”勃兰特解释说，“这是好事。因为艺术家们不必再浪费时间在小事上，他们的生产力必定就会提高。我预计即将会出现新的艺术形式并为此感到高兴。”

芝加哥大学学生姚元顺（音译）参与了一个探讨机器学习技术潜在风险的项目。他对一个由AI生成的奥巴马演讲视频进行了剪辑并开始思考：他能用文字做类似的事吗？

一个文本需要编得近乎完美才能欺骗到大多数读者，因此，他开始只制定一个小目标——去伪造点评网站Yelp或亚马逊平台的在线评论。这些评论只需几句话，也不需高水平的写作能力。所以姚元顺及其同事设计出了一个计算机神经网络，可以自动生成Yelp风格的点评。比如说，“我们最喜欢的地方”，“我和我的兄弟一起去了，吃了素食面，很好吃”。之后让人们猜测这些评论是真实的还是捏造的。人们很难辨别出来。雇佣水军进行虚假评价大约要花费10-50美元。姚元顺认为，只要工程师想，就能让虚假评论自动化。此外，他还探讨了如何使用神经网络来防御虚假评论的进展。“据我们所知，目前还没有出现这样的系统。”姚元顺说，“但也许在几年之后，我们就将被AI生成的信息所包围。”

他的下一个目标是什么？生成令人信服的新闻报道。

视频传播得可能会更快。检测假照片和视频的专家尼·法立德（Hany Farid）担心病毒内容传播速度太快，而验证过程又过慢。法里德认为，也许不久之后会出现伪造的特朗普总统视频并引发恐慌。“我尽量不做极端预测，但我认为这很容易发生。”他说，“今天就可能发生。”

语音合成初创公司琴鸟（Lyrebird）伪造的特朗普的演讲视频在互联网上传播开了，尽管在公司发布的音频片段中，特朗普的手指是离开核弹按钮的，演讲的内容也只是赞美琴鸟公司。公司联合创始人兼首席执行官约瑟·索特罗（Jose Sotelo）认为，技术发展是必然的，但需要道德准则的约束。他认为，现在最好的防御就是提高对机器学习能力的认识。“如果看到我在月球上的照片，你可能会马上意识到这是伪造的。”约瑟·索特罗说，“但是，如果你听到一段你好友的说你坏话的声音，你就很难鉴别真伪了。这是一项新技术，也是一个非常具有挑战性的问题。”

AI生成信息的浪潮势不可挡。最坏的情况是，骗子和政治人员会部署机器学习算法来产生大量伪造信息。再加上社交网络会有选择地传播最抓人眼球的内容，这样，那些伪造信息便会广为传播。

但看向好的一面，人工智能生成的内容也可能会极大地填补我们的社交结构，抚慰人们的心灵。琴鸟公司的索特罗期望其公司的技术可以使那些因病失声的人们重新开口。不止如此，AI在训练无人驾驶汽车方面也很有一套。通常情况下，驾驶软件先是在虚拟环境中进行训练的，但像“侠盗猎车手”这样的世界也只是大致类似于现实。人们利用AI算法无限缩小虚拟环境与真实世界之间的差别，最终使无人驾驶汽车更安全。

这是AI的正反两面。随着AI的不断改进，它也会越来越趋近于人类，并最终会完全具备人类特质——善恶共存。

转载于:https://www.cnblogs.com/guanghuan33/p/8116317.html

weixin_34102807

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
人工智能正在跨越“恐怖谷”，未来或将善恶共存

一场革命正在进行，可从条纹的变化里管中窥豹。今年，来自伯克利的研究人员发布了两个视频。第一个视频里是一匹马在围栏里小跑；而在第二个视频中，这匹小跑中的马却渐渐变成了斑马。当然，这只是围栏的条纹恰好投射在马的身上而让它看起来像是斑马一样，并非是说这匹马真的变成了斑马。把马变成斑马不止是个漂亮的噱头，还是机器学习算法重构现实的一个标志。例如，人们可以用图片编辑软件把图片里的黑熊变成熊猫，苹果变...
复制链接

扫一扫