本文参考论文: TILE-BASED QOE-DRIVEN HTTP/2 STREAMING SYSTEM FOR 360 VIDEO
一篇简短的review
主要内容
本文针对等矩形投影(ERP)存在大量冗余数据以及难以准确预测用户视点的问题。其使用了Sinusoidal projection(SP),正如下图所示,可以看出在同样的视点情况下,这种投影方式所需要传输的tile数量是要少,尤其是在两极区域。
由于在同一个视频中用户的感兴趣区域是相似的,所以可以利用其他用户的观看历史来预测视点。本文基于此想法,提出了一种基于KNN的视点预测法。该方法首先利用观看者的历史视点经过线性回归模型(LR)预测出该用户的下一个可能视点,随后通过KNN算法找出距离其最近的K个点,这样就可以形成一个可能的视口区域。如下图为K=4时的预测结果。
随后其通过一个QoE模型来挑选这个视口区域内的每个tile是否需要传输以及传输的码率。其模型如下所示。
其中i表示tile的编号,j表示传输的码率,η表示tile的实际比特率与原始比特率之前的质量方差(PSNR)的权重,R表示可用带宽,减少卡顿的可能性。
最后本文还设计了基于HTTP/2的K-push服务器,其允许服务器向客户端同时发送k个tile,这样就可以比传统的HTTP/1.1服务器节省至少K-1个RTT时间。
最终经过测试,文本实现的HTTP/2 360视频流媒体系统在大多数情况下需要传输的tile数量是比传统的ERP要少的,其所需要传输的比特率下降约17%,视口预测精度提高约30%,视区内的PSNR提高22%,传输延迟降低约30%。
思考
本文提出的这个HTTP/2 K-push服务器是一个不错的点,其可以有效降低传输延迟。其通过KNN来提升预测视点的准确性,但是假设历史用户视点在某一时刻比较分散,这样根据K个点确定的视区可能过大,这种情况下的预测结果可能会不尽人意。其次文中试验时所采用的视频片段间隔为1s,实验数据比较单一,如果可以像Flare中那样分好几个时间间隔多做一写实验测试可能会发现该系统的最佳性能,同时使实验结果更具说服力。