摘 要:
在近些年网络空间安全形势愈发严峻的情况下,对网络协议分析提出了越来越高的要求,其中,对未知协议分类分析更是亟需攻克的难点。针对未知协议的分类问题,提出一种基于层次聚类的多策略未知协议分类方法。该方法从传输控制协议头部特征、数据包的时空特征等维度入手,与马尔科夫链相结合,首先对收集到的网络数据进行预处理;然后提出可读性分类机制,并运用改进的层次聚类算法的多种聚类策略,发挥现代计算机的多核计算与单指令流多数据流优势;最后结合传输控制协议流中的二元组信息(目的 IP 和目的端口),对聚类结果进行调整合并,得到未知协议网络数据的分类结果。据真实网络数据验证表明,该方法对未知协议的分类准确率达到 96% 以上。
内容目录:
1 模型与方法
1.1 相关理论和方法
1.1.1 聚类算法分析
1.1.2 相关工作研究
1.2 协议分类模型设计
1.2.1 流量采集预处理
1.2.2 可读性分类
1.2.3 凝聚型层次聚类
1.2.4 改进的层次聚类算法
1.2.5 类簇调整算法
1.2.6 类簇合并算法
2 实验结果分析
2.1 评估方法
2.1.1 准确率
2.1.2 聚集度
2.2 结果分析
2.3 多策略效果分析
2.3.1 可读性策略分析
2.3.2 CAA 与 CMA 策略分析
2.3.3 计算策略性能分析
3 结 语
随着近些年互联网的不断发展,网络应用呈现爆发式增长,其中不乏大量使用自定义协议的应用。对于网络监