随着深度学习技术,视频编解码技术的发展,计算机视觉和视频行业又有了新一轮的热潮。各大公司google,facebook,microsoft,阿里,腾讯,百度等投入了大量的人力,物力在深度学习算法框架,视频编解码算法和流媒体技术中。感谢这些伟大的公司自己的技术开源,这使得越来越多的人参与到计算机视觉,计算机视频编码和传输的行业中来。
然而基于这些开源技术(Tensorflow,Caffe,AV1, X265,WebRTC等)的产品,离真正的高性能,高稳定性却依然有或近或远的距离。网上各种框架,算法讨论的很热闹,各种demo演示花样百出,却很少有基于开源技术的成熟产品。比之上一代视频编解码中的ffmpeg和x264对产业界的影响,这些开源技术,无论在性能,稳定性和可用性上都还有非常大的提升空间。H.264能雄霸计算机视频界十年,离不开高质量,易用的开源代码ffmpeg和x264。当下代表着计算机视觉和视频最高水平的深度学习和HEVC算法要想真正应用到产品中,不可离开高质量的开源代码。
本博专注计算机双视(计算机视觉和计算机视频)开源技术,参与到优化计算机双视开源代码的项目中,并在此分享自己在双视开源代码产业化中的经验,心得和体会,以帮助双视程序员更轻松的用上前述伟大的开源代码。