基于神经网络和编解码的个人思考(一)

基于神经网络的编码认识和思考

神经网络,重在ecoding和decoding,其中的输出层和输入层作为铺垫,核心的则是隐藏层。attention机制,CNN,ANN,LSTM,BP,等许多已有的经验和知识作为新技术和创新的基石。隐藏层中的感知机,梯度下降,函数tanh,sigmoid,Relu,DCT,傅里叶,拉格朗日,等已成熟的理论可方便被调用使用。

视频及图像编解码的成熟技术

关于编解的技术和理论:
1、耳熟能详的哈夫曼编解码是可变字长编码的一种:
核心在于理解取最小权重的值作为最底层数据,并两两加和形成新的节点进行数的构建,牵扯其中关于树的知识和数据结构的基础知识。
2、JPEG编解码:
关于图像有损的方向进行编解码,核心在于矩阵,DCT离散余弦变换,量化矩阵,之间的计算和数据的bit流计算。
3、H264、H265的无损压缩编码:
帧内,帧间的压缩。并且进行IDR,I,P,B帧之间进行规律性的压缩和编解码。难在无损,也价值于无损。内部的计算多是傅里叶,泰勒公式,拉格朗日和微积分的使用,进行对数据的剖析。
4、相关的算法:
包括snappy算法,gzip算法,Lz算法等。所有的共性,都是尽量使得数据向0&1靠近,向机器可以直接识别的模式靠拢。

FLowchart流程图

Created with Raphaël 2.2.0 开始 取某矩阵值 做减法与离散余弦 到极值后量化 继续做减法 结束

数据处理

绕不过去的坎,数据处理和分析,究竟使用什么方法进行数据之间的关系和函数的探索。各类机器学习的手段,聚类,回归,集成,决策树,最近邻,都可以去尝试。python 的sklearn或keras包中API都有。

最近思考的问题:

1、SVM将低维矩阵转成多维空间,并通过映射回低维后的数据规律探索,是否存在对编解码的价值?
2、神经网络的CNN,可以进行图片识别的核心计算,可否嫁接于视频的编码,对H264进行弥补?
3、神经网络的应用与编解码之间的共性,能否互不?神经网络多于应用层面发展,编解码多于底层发展,若是两者可结合,并进行深入,该多好。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值