音视频技术开发周刊

本文链接：https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/124239756

每周一期，纵览音视频技术领域的干货。

新闻投稿：contribute@livevideostack.com。

✦

一周简讯

✦

MPAI-MMC将被IEEE采纳为技术标准

在 MPAI Multimodal Conversation (MPAI-MMC) 获得批准满 6 个月的当天，IEEE 主持了 P3300 工作组的启动会议，任务是采用 MPAI 技术规范作为 IEEE 标准。早些时候，MPAI 和 IEEE 签署了一项协议，MPAI 授予 IEEE 将 MPAI-MMC 作为 IEEE 标准发布的权利。

Meta向“元宇宙”开发者抽成47.5% 比苹果30%还高

新浪科技讯北京时间4月12日晚间消息，据报道，对于在其“元宇宙”中销售虚拟产品的开发者，Facebook母公司Meta将向他们收取高达47.5%的费用，远远高于苹果公司App Store应用商店向开发者收取的30%费用。

Google 将把 AI 写作内容视为垃圾信息从搜索结果中移除

OpenAI 的文本生成神经网络 GPT-3 被认为能产生以假乱真的文章，那么搜索引擎应该如何对待它生成的内容？据Search Engine Land报道，Google 的 Search Advocate John Mueller上周在一场搜索引擎优化（SEO）的线上对谈中，在被问到Google对提供AI自动生成的内容会如何反应时，他表示这类网站将被归类在自动生成内容的网站，意指这违反了Google的网站站长质量指南。根据Google的网站站长质量指南，系统在大多数情况下都会自动发现垃圾内容并将其从搜索结果中移除。为了确保索引质量，Google还会采取手动操作将垃圾内容从搜索结果中移除。

百度开源PP-Human项目

飞桨目标检测开发套件 PaddleDetection 中提供的 PP-Human 是一套综合了目标检测、跟踪、关键点检测等核心能力的产业级开源实时行人分析工具。它基于企业真实场景数据打磨优化，拥有人体属性识别、行为识别与流量计数三大能力，兼容单张图片、单路或多路视频 3 种输入类型，还可适应不同光线、复杂背景及跨镜头场景！不仅如此，PP-Human 还直接提供目标检测、属性分析、关键点检测、行为识别、ReID 预训练模型，方便开发者灵活取用及更改。PP-Human 项目传送门:https://github.com/PaddlePaddle/PaddleDetection。记得收藏，防止走丢又实时关注更新。

TikTok向所有用户开放AR特效工具

TikTok正式向所有创作者和开发者推出AR效果工具。Effect House允许创作者制作自己的AR相机特效，让其他TikTok用户在视频中使用。该公司在一份声明中表示，该特效平台包括工具和学习资源，将向“世界各地的所有创造者、设计师和开发人员开放”。该公司讲道：“无论是用绿屏抠像把自己传送到一个新的世界，还是用时空扭曲扫描滤镜定格画面，这些抖音创意效果都能让创作者通过各种引人入胜的、沉浸式形式来表达、娱乐和分享故事。”TikTok公司表示，特效提交后需要经过审核才能使用。该公司明确表示将禁止“发布肤色歧视或其他负面刻板印象内容”的特效，以及“描绘如唇部填充等整容手术，或鼓励审视外貌”的特效。

✦

超级干货

✦

将音视频中的花屏、绿屏、黑屏问题一网打尽

今天给大家分享一下关于音视频中的黑屏、花屏、绿屏问题，这也是各大微信群里经常问的问题，这次争取将他们一网打尽，彻底解决了。

音视频开发之旅（五）MediaExtractor MediaMuxer 实现视频的解封装与合成

本文首先介绍了MediaExtractor MediaMuxer 能做什么，然后对视频解封装和合成的API以及流程进行了介绍，最后分享了三个实践实例，以及遇到的问题等。

关于音视频里面的解码帧率和渲染帧率

在知识星球里面有位 PM 同学，咨询关于音视频里面的解码帧率和渲染帧率，关于这两个概念其实挺绕的，不同的人可能还有不同的看法，所以也让大家一起来评估一下解读是否正确！

iOS AVDemo（8）：视频编码，H.264 和 H.265 都支持丨音视频工程示例

在音视频工程示例这个栏目，我们将通过拆解采集 → 编码 → 封装 → 解封装 → 解码 → 渲染流程并实现 Demo 来向大家介绍如何在 iOS/Android 平台上手音视频开发。这里是第八篇：iOS 视频编码 Demo。

FFmpeg命令分析-1