计算机视觉技术的前后身

  导语:今日看了一篇文章“北大校友马里千:计算机视觉商用的下一个十年,AI生成应占有下一席之地”有感,其中让我感兴趣的是文中提到的计算机视觉技术在互联网的一些设想与运用,其中就提到了:1.Nvidia开发的StyleGAN能够生成“不存在的人脸”图像,2.DALL.E根据文本提示生成对应的图像,3.马里千团队最新发表工作“RAL-ICRA”可以将一个窄视频自动生成宽视频,有望应用于电影特效场景的合成,4.生成式AI可不可以通过给其一部剧本自动生成一段视频呢,5.AI换脸技术(可不可以应用于身体呢,实现AI换体),6.通过识别目标的姿势并生成身体的纹理,在给定的自拍背景中完善与合成人物,达到“自拍”变成“他拍”,让我感触深刻,打破了固有的一些思维。

  简单说一下我看这篇文章的背景,一是最近老师组织了一个项目,差不多是复刻美国的一个软件叫homecourt,它的一些功能是1.识别篮球框及篮球场地线,2.对篮球进行跟踪并描绘其的一个运动轨迹,3.确定投篮的一个命中率,4.确定投篮点,其中有用到一个计算机视觉技术,所以我对这个计算机视觉技术多多少少是有一点了解的。二是最近ChatGPT实在是太火了,我是有用到的,并且深有体会。它可以通过你的文本提问进行各领域的回答,也可以通过你输入的文本要求来写一些简单的代码;让我意外的是它还可以通过文本提示自动生成图像、视频等等;三是互联网的发展。让我想到小到日常生活中的美颜拍照,抖音特效,其背后都是先进行对人脸的识别,要确定哪个是人脸,哪个是眼睛,哪个是鼻子等,再进行一些相应的处理,皮肤的美白,祛斑祛痘,添加装饰品,人脸变形等;再如动植物及物体的识别,它甚至可以告诉你这个动植物的具体名称,细致到它的全称,那个时候还没接触到计算机视觉技术,想着,它究竟是通过什么去辨别的呢,能有这么神奇嘛,后来知道了计算机的深度学习,简单来说就是你预先已经给计算机一些包含物体的图片,并且已经告诉了它这是什么东西,拥有了这么一个大量的数据集之后,你再去给它一张图片,它背后可能通过细小的一些眼口鼻、发色、形态等等的分辨,就可以达到精准的识别。

  首先我们需要了解的是什么是计算机视觉技术:用官方的话来说就是用摄影机和电脑代替人眼对目标进行识别,跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送仪器检测的图像,简单来说它就是通过计算机对图像或视频做一些处理,达到某些效果如物体识别及跟踪,轨迹预测描绘等等。

  其实在市场上已经有很多计算机视觉技术的应用了。比如说进出场所的1.人脸识别技术,它可以帮助考勤,设置门禁,进行人脸比对,检测及跟踪等等,还有2.图片识别,像最常见的相册分类,淘宝里的以图搜图,搜索相似商品,视频的鉴黄鉴暴力,指纹或者虹膜的识别匹配,还有3.文字识别,平常如相册里的提取文字,或者是大家都用过的小猿搜题,还有最近比较火的3.无人驾驶,其原理就是识别道路线、红绿灯、前后左右车辆等,再进行自动驾驶。大家用过比较多的可能是4.图片或视频的编辑,如ps,美颜。再如建筑行业的5.三维重建,3D打印,工业仿真等。可能你都还没发现,但它确确实实已经渗透在我们生活的各个方面了。

  在互联网飞速发展的现代,到处都充斥着图像与视频,而人类有70-80% 的信息来源于视觉。所以,计算机视觉技术的前景是相当开阔的。对此,我们可以做出大胆的设想,有没有一种可能,计算机可以根据文本提示生成一大段视频,做到电影、电视剧的程度,有没有一种可能,计算机可以根据人脸在监控视频中捕捉到人像,自动追踪其行踪轨迹,达到追踪那些失踪人员或者犯罪分子呢,有没有一种可能,计算机可以根据视频中人运动的情况,分析出此人的运动状态及未来的一个运动状态,有没有一种可能,计算机可以根据篮球足球比赛等的上半场运动情况,分析出下半场的比赛趋势,有没有一种可能,计算机可以根据父母的长相,预测孩子的长相呢,有没有一种可能,计算机可以根据幼年的长相,推测出成年或者老了之后的长相呢,有没有一种可能,计算机可以根据摄像机的摄影直接进行三维重建等等,有没有一种可能,计算机可以根据驾驶员的脸部特征判断其是否疲劳驾驶或者酒驾醉驾等,这些都是有可能的。

  在综合背景情况之下,我深刻感受到计算机视觉技术在互联网和生活之中的巨大影响,可以这样说,近来的ai绘画等只是计算机视觉技术的一个小小浪潮,只是一个简单的预告,而更巨大的海啸还在后头,这海啸也必将搅得一番天翻地覆,计算机视觉技术必将改变整个互联网时代,便利我们的生活,穿梭在我们生活的各个角落。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值