【globalbom2019】A Multi-View Deep Learning Model for Encrypted Website Service Classification
一种针对加密网站服务流量的多视图深度学习模型
这篇也是组里师兄的文章。
这篇文章太有自然语言处理那味儿了。
【主要工作内容】
- 提出了一种根据不同特征类型使用不同结构神经网络的分类模型
- 在网页流量分类方面提出一种新场景,分类粒度在网站分类和网页分类之间。比如qq的qq支付,在支付环节会涉及很多个网页,本文把这些网页都归为同一类别。
【收获】
-
收获一篇新的论文:W. Pan, G. Cheng, and Y. Tang, “Wenc: Https encrypted traffic classification
using weighted ensemble learning and markov chain,” in 2017
IEEE Trustcom/BigDataSE/ICESS, pp. 50–57, IEEE, 2017. -
被“大多数针对website流量分类的工作都是基于该网站主页产生的流量”启发,想到一个在细粒度行为识别方面的说辞:
大多数工作都仅基于针对访问应用主页所产生的流量,而忽视了更加细粒度的行为划分。例如,从某些监管角度来看,当用户访问一灰色地带软件时,若该用户仅进行如浏览文字、观看视频等“网站→用户”的单向信息流输出时,危险尚小;而当该用户进行文字评论、视频上传、图片/moment发表时,其进行了“网站between用户”的双向信息流传递,这些可能非法的信息则会被上传到网站服务器,从而产生更大的波及面。即,用户对同一应用的不同使用所带来的监管必要性也是不同的。因此,基于流量的细粒度行为识别是非常必要的。 -
一个将raw packets整合为flow的方法:用hash.基于四元组对每个数据包进行hash,这样,属于同一条流的数据包都会有相同的哈希值,根据哈希值来对数据包进行合并流处理。(好方法耶,虽然隧道流量不一定能用,因为隧道流量都是固定ip和固定端口号的流量。。但是之后应该有可以用到的地方)