基于神经网络的编码认识和思考
神经网络,重在ecoding和decoding,其中的输出层和输入层作为铺垫,核心的则是隐藏层。attention机制,CNN,ANN,LSTM,BP,等许多已有的经验和知识作为新技术和创新的基石。隐藏层中的感知机,梯度下降,函数tanh,sigmoid,Relu,DCT,傅里叶,拉格朗日,等已成熟的理论可方便被调用使用。
视频及图像编解码的成熟技术
关于编解的技术和理论:
1、耳熟能详的哈夫曼编解码是可变字长编码的一种:
核心在于理解取最小权重的值作为最底层数据,并两两加和形成新的节点进行数的构建,牵扯其中关于树的知识和数据结构的基础知识。
2、JPEG编解码:
关于图像有损的方向进行编解码,核心在于矩阵,DCT离散余弦变换,量化矩阵,之间的计算和数据的bit流计算。
3、H264、H265的无损压缩编码:
帧内,帧间的压缩。并且进行IDR,I,P,B帧之间进行规律性的压缩和编解码。难在无损,也价值于无损。内部的计算多是傅里叶,泰勒公式,拉格朗日和微积分的使用,进行对数据的剖析。
4、相关的算法:
包括snappy算法,gzip算法,Lz算法等。所有的共性,都是尽量使得数据向0&1靠近,向机器可以直接识别的模式靠拢。
FLowchart流程图
数据处理
绕不过去的坎,数据处理和分析,究竟使用什么方法进行数据之间的关系和函数的探索。各类机器学习的手段,聚类,回归,集成,决策树,最近邻,都可以去尝试。python 的sklearn或keras包中API都有。
最近思考的问题:
1、SVM将低维矩阵转成多维空间,并通过映射回低维后的数据规律探索,是否存在对编解码的价值?
2、神经网络的CNN,可以进行图片识别的核心计算,可否嫁接于视频的编码,对H264进行弥补?
3、神经网络的应用与编解码之间的共性,能否互不?神经网络多于应用层面发展,编解码多于底层发展,若是两者可结合,并进行深入,该多好。