商汤用AI复活了汤老师

在商汤2024年年会上,汤晓鸥教授以数字人形象回归,展示出如影数字人技术的高仿真效果。演讲中回顾了AI的前瞻性,以及大模型的应用,如生成多语种数字人和微调模型。内容涵盖了AI技术的发展、创新与应用,以及对未来的思考。
摘要由CSDN通过智能技术生成

大家好,我们又见面了。

在商汤2024年年会上,汤晓鸥数字人现身,来了一场跨越时空的重逢。

按照以往习惯,每年汤老师都会说上一段脱口秀,已经成为商汤年会保留节目。

熟悉汤老师演讲都知道,他是被人工智能事业耽误的“脱口秀大师”,如今以数字人的形象,再度用幽默的方式与我们相见。

除了被他的幽默感染,不少人还被逼真的效果所惊艳,堪称**“年会最佳彩蛋”**。

在这里插入图片描述

并由此引发大家对汤教授的怀念。

在这里插入图片描述

汤晓鸥数字人现身商汤年会

不讲企业经营,也不讲公司管理。还是老规矩,唠两句嗑。

每年汤晓鸥演讲的开场都是“我们先来复习一下去年的演讲”,今年数字人也不例外。

按照商汤CEO徐立的话说,这是特有的汤氏套娃演讲风格

复习之前,他被cue到“弹钢琴”,结果他说:今年没接到通知啊。

到了正儿八经的复习环节,结果已经有人会抢答了。(Doge)

首先他说道:自己的推荐是有一点前瞻性的。嗯,确实是这样的。

比如《波西米亚狂想曲》第二年就斩获奥斯卡;还有“人类文明的起点是一根愈合的大腿骨”结果被引用到《流浪地球2》中李雪健老师拯救地球去了;最后还是聊到了他多次提及的“大兄弟”——宫崎骏,重出江湖拍了部《苍鹭与少年》……

他感叹像宫崎骏这样的大师创作并不容易,“人生中最重要的事就是很麻烦的”,对此他也深有体会。

比如徐立每次深夜找他要聊聊的时候,他都有这样的感觉。对此他的解决方案是:

既然解决不了麻烦的问题,那就要解决麻烦的人。所以索性不接他的电话。

后来麻烦的人越来越多,他就直接选择关机

之后,他提及了最近上映的《热辣滚烫》、东北取材电视剧《漫长的季节》,并借着《漫长的季节》结尾桥段“火车在天地里往前开”,谈到商汤也坐着新洲楼下小火车,在AI这条路上往前开。

你看要不说咱们有前瞻性呢,小火车在2021年就备好了,就等着《漫长的季节》火一把呢。

谈到今年春晚最幽默的新疆人小尼,他作为东北人不服气,于是推荐了一部小品《吃面条》。并介绍了这背后的花絮,正是因为编导最后开播前确定让演员上场,才有了春节第一部小品。

借此就来到了他以往多次提及“原创”这件事。不得不说,这很汤式风格。

坚持原创这件事,是留给有勇气的人做的;而真正支持创新的人,是有勇气担责的。

也因为这样的坚持,才有了喜剧事业蓬勃发展,才有了很多优秀的喜剧工作者。

赵本山、赵丽蓉、冯巩和我。

(传下去,这是四大喜剧天王)

最后他谈到以前的喜剧之所以那么好看,是因为时间的沉淀才成为经典。也许前路一片迷雾,而他们只是一群选择出发,并坚信赶路的人。

还是一样的引经据典,还是一样的汤式风格,这样一段不足十分钟的数字人演讲已经让人感怀。

AI的高级意义。
在这里插入图片描述

动容的同时,也着实被技术细节惊艳到了。比如中场汤老师还喝了一次水。

效果这么逆天吗?其他家都是正脸,这个低头和手部动作都挺自然的。

在这里插入图片描述

打破次元的如影数字人技术

真实世界的汤晓鸥老师已经与我们告别。这一次特殊演讲的开篇,就提到让汤老师“跨越次元”的,是商汤如影数字人技术。

最早在去年四月,商汤发布“日日新”大模型体系,如影(SenseAvatar)首次亮相。

据了解,仅需要5分钟真人视频素材,如影就可以生成出动作声音自然、口型准确、多语种精通的数字人分身。

3个月后,商汤“日日新”大模型体系全面升级,如影也进化到了2.0版本。

语言方面,如影2.0打造的数字人将英语、日语、西班牙、阿拉伯语等多语种的精准度提升30%以上,而且口型和语音匹配得更加自然。

生成效果方面,如影2.0支持实现影级4K高清视频的输出,成片质感再度提升。

同时也带来了新玩法,用户可通过输入提示词自动生成与描述匹配的专属数字人形象,还是可以实现数字人歌唱功能的那种。

电影照进现实

当汤晓鸥数字人现身为大家表演脱口秀的那一刻,其自然逼真的表现效果让不少网友为之震惊,直呼这就是《流浪地球2》照进现实。

这一场景,就如电影中,科学家图恒宇通过量子计算机“复活”了其因车祸去世的女儿:

在这里插入图片描述

其实,类似案例如今正在更为频繁地照进现实。

比如,音乐人包小柏同样依靠AI技术,“复活”了女儿。

在这里插入图片描述
抖音热榜

2021年包小柏的女儿因罕见疾病去世,年仅22岁。经历失去爱女的悲痛后,包小柏决心攻读博士开始钻研AI技术,期望能在虚拟世界中保存女儿的存在。

经过反复探索,包小柏如愿复刻出了“数字女儿”,在包小柏妻子生日当天,“女儿”还为妈妈唱了一首生日歌,为这个家庭带来了些许慰藉。

来源:红星新闻

B站up主吴伍六,前段时间用AI工具生成了奶奶的虚拟数字人,也引起了不小关注。

只见视频中,数字人“奶奶”讲着流利的湖北的方言与up主对话。

如奶奶生前一样,嘱托其父亲“别喝酒,要节约,别打牌”:

事实上,自生成式AI技术兴起以来,一直有人在探索用AI“复活”亲人这种方式来寄托思念。

比如在三年前,当时最先进的对话系统,还是由GPT-3驱动。一位因未婚妻离世而备受折磨的青年约书亚,就决定用技术“复活”亡妻。

根据程序设定, “她”和人类一样有着生老病死,每说一句话,寿命就减少一点。

当“她”只剩20%寿命后,会开始胡言乱语。当系统寿命耗尽到0%,虚拟人的生命也走向终结。

在这里插入图片描述

如今,随着技术发展逐渐成熟,远去之人的身影已经可以做到具象化。说话风格、语音语调、还有外在形象也都能完整地保留。

这段时间,视频生成的进展如火如荼。像阿里就发布了个由音频驱动的肖像视频生成框架——EMO。

输入单张参考图像,以及一段音频(说话、唱歌、rap均可),就能生成表情生动的AI视频。

于是就有人生成哥哥张国荣,为大家带来一首陈奕迅粤语版的《无条件》。

或许之后随着技术逐渐进化,人类的思念也将有实实在在的归处。

最后,没想到还能再以这种方式见到汤晓鸥教授。感念!

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

123?spm=1001.2014.3001.5501)这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

  • 12
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值