央视春晚的元宇宙技术,微软发布AI声音生成工具VALL-E,百度将推出类ChatGPT风格机器人,2023WebRTC预测…...

2023年春晚运用多项AR技术提升视听体验,苹果公司正在开发MR头显及配套的Siri驱动的内容生态系统。百度计划推出类似ChatGPT的AI聊天机器人服务,微软发布了声音生成工具VALL-E,能模仿人声。此外,AmazonChimeSDK增强功能,支持每个会话最多250个网络摄像头视频流。
摘要由CSDN通过智能技术生成

c70c552b58350d967b4e185a1ddfe94e.gif 点击上方“LiveVideoStack”关注我们

11b2c7c2405081c021eade8f658f00fe.png

▲扫描图中二维码或点击阅读原文

了解音视频技术大会更多信息

🐰正月十一,开工大吉🐰

以下均为节选内容,点击相关文字即可跳转原文

f717b2680ffbad3566825fc08077bab9.gif

“硬科技”满满,盘点2023央视春晚的元宇宙技术

据报道,2023年春晚共有5个 AR 虚拟机位,是历届春晚中最多的一年,覆盖整个演播大厅。还首次在三维索道摄像机中加入 AR 技术,力求为电视机前的观众带来更加丰富的视听感受。其中涵盖的技术包括:AR+动作捕捉、AR+虚拟制片、VR绘画+AR互动、XR虚拟场景、AR+AI绘图。

0d3f9cdf9fd1794f752ce55debe40dd7.png

▲网传苹果MR头显渲染图

让Siri打造“元宇宙”?苹果MR头显内容生态大起底

苹果MR头显要来了——紧跟而来的,会是MR内容生态爆发吗?

8K显示屏、64颗摄像头、双芯片设计......除了这些耳熟能详的苹果MR头显硬件爆料信息外,近日彭博社和科技媒体The Information接连爆料苹果在MR内容生态的布局,并且揭露了其多个内容“杀手锏”。

据悉,苹果MR内容开发项目主要由⼀个内部代号为Z50的秘密团队承担,该团队大约有几十人,其员工主要来⾃视频、游戏等⾏业。并且,苹果还在打造一款内容开发工具,希望让不懂编程的人也能通过Siri语音助手,构建自己的MR软件,并上线App Store。此外,苹果MR头显除硬件参数之外,还有一大秘密武器:MR内容生态布局。在这里,苹果将用一些新的玩法和技术创新,试图重新带动整个VR/AR行业。

e1e7484a96a2f144d293838300a65e40.jpeg

百度将于3月推出类ChatGPT风格的机器人,嵌入到自家搜索服务中

据一位知情人士透露,中国搜索巨头百度计划推出与 OpenAI 的 ChatGPT 类似的人工智能聊天机器人服务,这可能是中国在这款现象级的科技产品引发的竞赛中最引人注目的参赛选手。

据要求匿名的这位消息人士表示,百度计划在今年 3 月份推出类似 ChatGPT 风格的应用,一开始会将其嵌入到公司的主要搜索服务中。这一工具的名称尚未确定,但它将会让用户获得对话式的搜索结果,就像 OpenAI 那个流行平台一样。

e084bd12e13329fc6f9a7602f9b268d4.png

▲微软研究人员提供的VALL-E框图

微软发布AI声音生成工具VALL-E,只需3秒音频即可模仿人说话

近日,微软研究人员宣布了一种新的文本转语音AI模型,称为VALL-E,当给出三秒钟的音频样本时,它可以精确地模拟一个人的声音。一旦它学会了一个特定的声音,VALL-E可以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。

它的创建者推测,VALL-E可用于高质量的文本转语音应用程序、语音编辑,其中可以编辑一个人的录音并从文本转录中更改(让他们说出他们最初没有说的话),以及与其他生成AI模型(如GPT-3)结合使用时的音频内容创建。

6231bcb5543db97b641821d574b6b0f9.png

Amazon Chime SDK 现支持 250 个网络摄像头视频流

Amazon Chime SDK 现支持每个 WebRTC 会话中使用最多 250 个网络摄像头视频流。Amazon Chime SDK 让开发人员能够在其 Web 和移动应用程序中添加智能实时音频、视频和屏幕共享。每个 WebRTC 与会者都可以启用网络摄像头视频,并查看来自其他与会者的最多 25 个网络摄像头视频流的任意组合。

开发人员可以根据每个会话参与者的角色为其创建量身定制的视图。例如,在一个在线学习应用程序中,教师视图可能包括一个包含 10 个学生的网络摄像头视频的面板,用于自动滚动浏览整个班级。学生视图可能专注于展示共享内容,但也留有专用空间用于显示来自教师、任何积极发言的学生及其若干好友的网络摄像头视频,由学生自行选择。

https://aws.amazon.com/cn/about-aws/whats-new/2023/01/amazon-chime-sdk-250-webcam-video-streams/

28b9f93e9972725534d6b9981a4ffd46.jpeg

2023 年 WebRTC 预测

BlogGeek.Me近日发布了2023年的WebRTC预测,并基于WebRTC技术、WebRTC 中的开源、CPaaS和WebRTC等三方面进行全面解析预测。

https://bloggeek.me/webrtc-predictions-2023/


▼识别二维码或猛戳下图订阅课程

113f82eb18a9662d8666203fd88dcaf2.jpeg

喜欢我们的内容就点个“在看”吧!339a214b1f11cbc558723e398a1c167c.gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值