![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
音视频
文章平均质量分 68
学习音视频相关知识与总结
darlingmz
这个作者很懒,什么都没留下…
展开
-
AV1视频编码格式
背景:开发进行技术分享,给出了AV1与VP8和H.264的编码效果对比图。优点:编码速度快、性能消耗低、同码率下画质更清晰、同画质下视频压缩率更高。原创 2024-06-03 14:45:43 · 1518 阅读 · 1 评论 -
【opencv】ffmpeg录制 + opencv绿屏识别脚本
利用ffmpeg的录制 + 切片截图 + opencv图像分析。需要安装ffmpeg/ffplay、opencv库等。原创 2023-06-27 17:35:17 · 1414 阅读 · 0 评论 -
【图像算法】马赛克识别
八点判断法:选取正方形中的八个点来进行判断,如果选择的八个点都满足构成正方形条件,那么,认为此正方形存在。这种方法的优点是运算速度有所提升,但是准确率上存在不足原创 2023-01-29 15:35:38 · 2320 阅读 · 0 评论 -
【音视频工具】前端屏幕录制工具 + 录制<video>标签内容
网页版本的推、拉流页面,含有标签,屏幕录制需要处理很多边角,选择直接录制流内容本身,录制标签内容原创 2023-01-29 10:55:14 · 901 阅读 · 0 评论 -
【opencv】获取视频中的“黑白蓝绿”屏
长视频文件中,检测异常画面帧出现的次数以及截图报错,替代人工检查(附代码)方案一:**像素点:(height, width, channels)** 方案二:**二级图:RGB/HSV颜色**原创 2022-12-30 15:19:50 · 751 阅读 · 0 评论 -
【图像算法】pytesseract简单实现图片数字识别
关键语句:pytesseract.image_to_string 基本语言库,可支持汉子和数字的识别原创 2022-12-30 14:48:55 · 2957 阅读 · 4 评论 -
【音视频】工具汇总篇
波形图可视化、YUV可视化原创 2022-08-18 14:31:51 · 277 阅读 · 0 评论 -
【音频测评】全参考测评
VMAF学习总结原创 2022-08-18 14:27:15 · 821 阅读 · 0 评论 -
【音视频】2021年终RTC一些服务问题记录
网络运营商 T-Moblie无法开播问题:主播切zego可开播,目前正在配合美国同事复现定位中,尽量定位修复后发版本。PK、连麦回声:11月30号修改线上配置后,没有新增反馈,12月3号(4.3.20)带上日志方便之后定位,基本解决。回放相关:12月3号(4.3.20)优化解决拉取进度条失败,12月4号服务端优化了回放卡顿问题,已解决。解决:亚欧合并后请求center,会307问题,提高拉流成功率100%开播没有声音:个例音视频设备启动失败,定位中,请用户重新开播可恢复。拉流者B级联,从A所在的节点拉流。.原创 2022-08-18 14:16:04 · 139 阅读 · 0 评论 -
【音视频】WebRTC拥塞控制学习(看了个皮毛)
书籍学习:《WebRTC音视频实时互动技术》原理、实战与源码分享作者博客:https://avdancedu.com/目的:了解一些底层的实现逻辑,不是单纯的知道发送端码率自适应拥塞算法分类GCC:谷歌拥塞算法BBR:瓶颈带宽和往返传播时间(QUICK协议)PCC:基于性能的拥塞控制目前采用自研的WebRTC服务:GCC中的TCC目的:减少发包量,抢占更多的带宽基于时延的拥塞评估算法(比较复杂)1. Goog-ERMB:Google接收端评估的最大码流卡尔曼滤波器接收端,.原创 2022-03-30 10:09:00 · 380 阅读 · 0 评论 -
【音视频】测评工具VMAF
PS:学习地址Mac安装教程:https://testerhome.com/topics/25083命令汇总# 编译环境准备brew install gcc meson doxygen nasm freetype pkg-config hdf5brew install numpy scipy# 下载源码git clone https://github.com/Netflix/vmaf.gitcd vmafgit submodule update --init --recursive.原创 2022-03-29 16:22:26 · 667 阅读 · 0 评论 -
【音视频】WebRTC实现一对一通信 与 各端的互通互联
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代.原创 2022-03-29 15:52:01 · 5528 阅读 · 0 评论 -
【音视频】技术提升2.0
一、视频1. 视频即连续的图片所谓视频,就是连续的图片每一张图片称为一帧,每秒播放多少幅图片称为帧率2. “原始”视频原始“视频”即一张一张连续存储的“原始”图片。所谓“原始”,就是逐像素描述一张图,从左上角第一个点,到右下角最后一个点。每个像素点用3个数字表示它的红(R)绿(G)蓝(B)程度,即 RGB 格式图片。跟 RGB 类似的还有 YUV,也是每个像素点用3个数字来表示,Y表示亮度,U、V表示色度。2.1 RGB 和 YUV 的格式说是用 3 个数字(即 3 个字节)表原创 2022-03-28 17:55:49 · 3118 阅读 · 0 评论 -
【音视频】常见问题整理 - 技术提升1.0
1.IDR帧与I帧区别?IDR帧比I帧多些什么信息答:2.音视频-音画不同步的策略将视频同步到音频上:就是以音频的播放速度为基准来同步视频。将音频同步到视频上:就是以视频的播放速度为基准来同步音频。将视频和音频同步外部的时钟上:选择一个外部时钟为基准,视频和音频的播放速度都以该时钟为标准。常见:音频线性增长为参考,视频同步,及时反馈调整做同步。3.视频从录制 - 播放...原创 2022-03-28 17:47:19 · 1821 阅读 · 0 评论 -
【音视频】编/解码 - 编码器底层原理学习顺序
# 目的:如何进行编码器的选择,在做编码效率测评的时候,需要去了解编码器的工作原理# 简单知识储备编码器类型:H.264H.265微帧AVIVP9, AV1 和 HEVC编码器的各种帧(概念理解):I帧:关键帧。是自带全部信息的独立帧,是最完整的画面(占用的空间最大),无需参考其它图像便可独立进行解码。视频序列中的第一个帧,始终都是I帧。I帧与IDR帧的区别:P帧:“向前预测”。需要参考前面的I帧和/或P帧的不同部分,才能进行编码。P帧对前面的P和I参考帧有依赖性。但是,原创 2022-03-28 17:35:48 · 1666 阅读 · 0 评论 -
RTC SDK 自动化测试 - 需求落地
实现:Demo层的自动化实现可完成的事情(UI自动化)崩溃稳定性测试黑盒测试白盒测试功能稳定性测试基础功能稳定性测试:加入房间、推拉流、上下麦、退出房间、断网重连、切后台等各种操作下功能是否正常特定功能稳定性测试:根据具体功能场景编写测试脚本程序;极值测试连麦极值测试观看极值测试可自定义分辨率、码率、帧率、时间、时长、设备数量、指定设备媒体指标测试加入房间成功率测试推流成功率测试拉流成功率测试延时测试卡顿测试流量测试性能指标测试CP原创 2022-02-23 14:38:13 · 545 阅读 · 0 评论