AI驱动的智能图形应用

最新推荐文章于 2023-05-11 14:13:16 发布

LiveVideoStack_

最新推荐文章于 2023-05-11 14:13:16 发布

阅读量1.7k

点赞数 2

本文链接：https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/104285857

版权

本文介绍了相芯科技的蔡锐涛在LiveVideoStackCon2019深圳站上的分享，探讨了AI如何驱动智能图形学的发展，包括AR视频中的虚拟形象生成、驱动技术和人像美化，以及AI视频的合成技术。分享了如何利用AI自动化生成视频内容，如虚拟主播和虚拟助手，并展示了相关应用场景和落地案例。

摘要由CSDN通过智能技术生成

高速5G和性能更强大的终端为社交、游戏、教育等场景带来的更丰富的互动体验，本文内容来自相芯科技的蔡锐涛在LiveVideoStackCon2019深圳站上的精彩分享，他将介绍AI驱动的智能图形应用，以及因此带来的新的用户交互方式。

文 / 蔡锐涛

整理 / LiveVideoStack

大家好，我是相芯科技的蔡锐涛，很高兴今天在这里与大家分享交流。今天与大家分享的题目是AI驱动的智能图形应用。按照惯例，我简单介绍下我们公司。

相芯科技专注于智能图形技术的创新与应用，为移动互联网、AR、AI提供3D内容生成与互动的行业解决方案。我们致力于将好莱坞电影级别特效技术应用到消费级中来普及它。举例来说，我们开发了一个AI助手——Alice。大家听到的声音、看到的视频以及嘴唇与声音的实时同步都是由程序实时合成出来的视频。随着我后面的介绍，大家会对这个领域有更深入的了解。

今天我的分享包括三个部分，第一部分，我会简单介绍下智能图形学，第二部分我会从AR视频、AI视频两个方面介绍智能图形学在应用视频领域如何创造价值。

这里我们所说的AR视频不是指一些AR效果，而是泛指利用增强现实的方式丰富视频内容。这里我会分享三点：一个是全自动千人千面的虚拟化个人形象的生成；第二个是基于单目相机、普通摄像头的虚拟形象全身的驱动技术，包括表情、肢体、手指；第三个是人像视频的美化，从开始的美颜到后面的美妆、美发以及全身美体。

在AI视频领域，我会介绍如何利用人工智能技术自动合成视频。其中会重点介绍虚拟主播以及虚拟助手的核心技术方案。同时我会介绍照片级视频合成技术，最后会介绍这一领域技术的应用场景以及一些落地案例。

1. 智能图形学

首先，我来简单介绍下智能图形学，计算机图形学解决的问题是让计算机生成图形图像，在一般意义上这里主要涵盖三个问题，第一个是如何构造三维数字世界模拟现实世界（建模），有了这些虚拟对象后，我们要考虑如何让这些对象动起来，实际上是一个运动仿真的过程，第三个问题是利用计算机光与场景的交互，生成一张足够好看的图像。

一切需要视觉交流的应用都可以用到计算机图形学，这里面包括工业制造方面的CAD、CAM，一些电影的特效文化创意，还有可视化、仿真训练以及数字化文物保护。

传统的计算机图形学解决的是专业用户如何生成图形给人看的问题，这是一个PGC的范畴，最常见的就是电影和游戏，需要动画师，美术以及游戏设计师做出内容给消费者看。近年来，计算机图形学希望解决的内容是普通用户可以生成图形内容，这属于UGC范畴。计算机图形学，加上计算机视觉、机器学习、人机交互之后，能够更自动化的生成一些内容以及更自动化地进行内容交互，这便形成智能图形学的概念。

传统的计算机图形学主要是用数学建模的方式模拟现实世界，进行渲染，仿真。内容生成方式是手动生成，交互手段也是比较传统的。我们新一代图形学是从大量数据中学习一些知识，学习如何生成好看的图形和新的交互方式，尝试改变图片的生成方式，使图片生成方式更加自动化，生成的图片更加自然。