转行音视频研发的随想

作者分享了从银行业务软件开发转行到音视频技术的心路历程,探讨了声音三要素、视频相关概念、编码格式、网络传输协议等关键知识点,并强调了学习音视频技术的挑战与投入。同时,提到了自我学习的方法,如通过CSDN等平台寻找资源,以及对知识付费的认同。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

去年进入新公司,接触到视频、音频的相关概念,仿佛打开一扇新窗户,找到未来的发展前景,趁着有时间总结下最近一段的学习成果。
声音的三要素:采样率、位深、采样大小
视频相关:YUV/RGB、分辨率、帧率、码率、GOP、I/P/B帧
输入:摄像头、麦克风(系统自带和外接设备)采集声音和图像
音视频数据的编码格式、封装格式
视频音频数据的编码解码技术(硬件/软件编解码)
音视频领域的网络传输协议:RTP、RTSP、RTMP、HLV
回声消除实现方案
音视频数据的时间同步
图像声音的渲染播放
多路视频画面的合并输出
画面有花屏、黑屏、卡顿延时怎么解决
排查问题的思路方向、使用的工具软件

自己下班时间研究FFmpeg功能、流媒体开发(SRS流媒体服务器)、Webrtc视频通话和会议 关注行业最新的发展东向:CDN网络集群、云原生 日常生活场景:语音识别、人脸识别、统计在线参会人个数(调用第三方的接口,根据脸部轮廓识别) 商业领域:大规模娱乐直播、在线教育、实时会议、抖音短视频、直播带货、美颜滤镜 未来在元宇宙、新能源汽车的视频音频互动、AR/VR、人工智能等领域的应用。 掌握的编程技能 C++相关的技能:迭代器、容器、队列、单例模式、多线程、线程锁、文件锁、进程间通信、网络编程(MAC地址获取、ioctl设置缓冲区大小)。 还有哪些关键技术点需要补充: 音视频学习门槛比较高,搭建环境,编译代码、遇到没有声音和视频输出、画面模糊等各种问题 市场上缺乏技术资料和书籍,找不到专业的技术人才和课程,全靠自己摸索 劝退大部分人,没有对技术钻研的兴趣和锲而不舍的坚持,不能在音视频道路上走远。

我这也算是转行了,职场生涯前几年做银行业务的软件开发,数据库、shell脚本、操作系统、网络传输(HTTP/HTTPS/),报文加解密和签名验签,工作中理论和实践结合,学会沟通和管理,增强软实力。 某项技术会使用、懂原理是两种不同的层次,实用主义,选择对自己当前工作有最大帮助的。 学了某种技术,工作中没有应用的场景,无法实操,时间久了就会忘记,所以要学会做笔记。 转行必然意味着从头开始,空杯心态,学习新知识,好在技术的底层都是相通的,工程师眼里计算机学科的根基是不变的。基本原理是树根,然后才衍生和分散出不同的技术栈。盘点自己的技能树:操作系统、网络编程、数据库、也了解redis集群,MQ消息中间件等,毕竟2022年在极客时间上学习了不少新东西。既巩固基础也开拓了眼界,扩大知识面。这些知识积累都是内功心法,让我学习音视频相关技术时有底气,更容易入门上手。

学习过程中当然要舍得给自己投资:花钱买课程资料、专业的书籍、CSDN的专栏等。我始终认为:物有所值,虽说无私分享是美德,但是作者也要生活,不可能总是为爱发电。不能总是白嫖别人的资源,为知识付费才是真正的尊重人才。

我通过CSDN查找答案的的过程中,根据博文探索发现了好多业界大神,有的是人工智能领域的专家,有的是嵌入式开发的大佬,有的是全栈工程师,有的是大厂高级研发人员,甚至还能看到技术领域的自媒体人,在B站、公众号、知乎、掘金等各大平台都有活跃。他们的专业技能、乐于分享的精神让我敬佩。优秀的人果然是惺惺相惜的,大家互相关注,互相学习交流,通过输出文章帮助更多的人,无形中也扩大了自己在行业内的影响力,打造自己的口碑,反过来,读者的反馈和回报,也让作者更有动力创作,大家相互成就,相互滋补,共同进步。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值