2021“中兴捧月“图灵赛道总结

最新推荐文章于 2022-09-11 09:59:51 发布

JeJe_33

最新推荐文章于 2022-09-11 09:59:51 发布

阅读量319

点赞数

分类专栏：竞赛文章标签：深度学习

本文链接：https://blog.csdn.net/qq_44807945/article/details/118364040

版权

竞赛专栏收录该内容

1 篇文章 0 订阅

订阅专栏

赛道选择上还是出了些问题，对于编解码不够熟悉导致决赛在理解题意上就费了不少时间，不过也是第一次参加这种竞赛，也算是有所收获了，而且zte的工作人员都挺热情的，接下来会更多刷题和刷题思路的更新了。

1.初赛

初赛就是对YUV视频进行压缩，大概做法有使用ffmpeg直接转换格式进行压缩或者使用Huffman树重新编码，相对来说我选择的是偏向数据处理，用了个svd压缩，大概思路如下：
压缩思路：
已知分解出的sigma对角线矩阵前10%对角线元素包含99%以上的矩阵信息，即假设原数据矩阵为mn矩阵，分解后得到mm左奇异向量u，mn奇异值对角线矩阵sigma，nn右奇异向量v，若对角线矩阵取前k个对角线元素，即只需保存mk矩阵u，kk矩阵sigma，kn矩阵n，在转码时将其相乘得到包含原矩阵大部分信息的数据矩阵，此时矩阵信息由mn下降为k*（m+n+k）；进一步，由于sigma为对角线矩阵，只需保存对角线元素即可，需保存信息进一步下降为k*（m+n+1），并使用numpy.savez_compressed将三个矩阵打包

2.决赛

2.1赛题解析
决赛这里主要说第一题，题意可以理解为当使用tile编码（即将视频按照长，宽分别分块）如何预测vr视频中头动数据集落入点的权重（可以理解为每个人看vr视频时都有侧重点，通过预测每个tile的权重可以优化低带宽时观看vr视频的质量（低权重采用较低的质量））
2.2赛题思路
首先给定数据集记录的是观测者在观测视频时观测目标的位置，以此我们可以以一定时间间隔，统计该时间段内观测者观看各tile的概率，以此为标签，时间段内视频取帧作为输入。
思路有两个，一个是用一些成熟的模型作为特征提取器，提取出输入图片（帧）的特征，再用一些类似svm的机器学习方法构造模型预测概率，比赛中用的是另一种思路，用了vgg作为backbone，将问题转化为多标签分类问题（可以输入软标签，即各类概率，如三类：[0.3,0.4,0.3]），损失函数使用BECloss。
2.3结果
模型跑的效果还可以，可惜后面没时间进行其他的想法的验证了，模型结果损失0.007左右，以此拿来验证与真实分布的相关性为97.7%