2021“中兴捧月“图灵赛道总结

赛道选择上还是出了些问题,对于编解码不够熟悉导致决赛在理解题意上就费了不少时间,不过也是第一次参加这种竞赛,也算是有所收获了,而且zte的工作人员都挺热情的,接下来会更多刷题和刷题思路的更新了。

1.初赛

初赛就是对YUV视频进行压缩,大概做法有使用ffmpeg直接转换格式进行压缩或者使用Huffman树重新编码,相对来说我选择的是偏向数据处理,用了个svd压缩,大概思路如下:
压缩思路:
已知分解出的sigma对角线矩阵前10%对角线元素包含99%以上的矩阵信息,即假设原数据矩阵为mn矩阵,分解后得到mm左奇异向量u,mn奇异值对角线矩阵sigma,nn右奇异向量v,若对角线矩阵取前k个对角线元素,即只需保存mk矩阵u,kk矩阵sigma,kn矩阵n,在转码时将其相乘得到包含原矩阵大部分信息的数据矩阵,此时矩阵信息由mn下降为k*(m+n+k);进一步,由于sigma为对角线矩阵,只需保存对角线元素即可,需保存信息进一步下降为k*(m+n+1),并使用numpy.savez_compressed将三个矩阵打包

2.决赛

2.1赛题解析
决赛这里主要说第一题,题意可以理解为当使用tile编码(即将视频按照长,宽分别分块)如何预测vr视频中头动数据集落入点的权重(可以理解为每个人看vr视频时都有侧重点,通过预测每个tile的权重可以优化低带宽时观看vr视频的质量(低权重采用较低的质量))
2.2赛题思路
首先给定数据集记录的是观测者在观测视频时观测目标的位置,以此我们可以以一定时间间隔,统计该时间段内观测者观看各tile的概率,以此为标签,时间段内视频取帧作为输入。
思路有两个,一个是用一些成熟的模型作为特征提取器,提取出输入图片(帧)的特征,再用一些类似svm的机器学习方法构造模型预测概率,比赛中用的是另一种思路,用了vgg作为backbone,将问题转化为多标签分类问题(可以输入软标签,即各类概率,如三类:[0.3,0.4,0.3]),损失函数使用BECloss。
2.3结果
模型跑的效果还可以,可惜后面没时间进行其他的想法的验证了,模型结果损失0.007左右,以此拿来验证与真实分布的相关性为97.7%

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值