加密流量分析-3.数学理论方法

1.信息熵

加密后的流量呈现均匀分布的特点,因此计算信息上可以很好地判断流量是否被加密。
信息上的定义如下
H ( X ) = − ∑ i = 1 N p ( x i ) l o g 2 p ( x i ) H(X)=-\sum^N_{i=1}p(x_i)log_2p(x_i) H(X)=i=1Np(xi)log2p(xi)
当X中所有元素出现次数相同时,及服从均匀分布时,熵的值最大。
为了能更好的比较熵的大小,定义标准熵为
H N ( X ) = − ∑ i = 1 N p ( x i ) l o g 2 p ( x i ) l o g 2 N H_N(X)=-\frac{\sum^N_{i=1}p(x_i)log_2p(x_i)}{log_2N} HN(X)=log2Ni=1Np(xi)log2p(xi)
其中 N N N X X X中包含的离散变量个数

设有序列X=ababa
选取步长为1,则 Σ 1 = a , b \Sigma_1={a,b} Σ1=a,b N 1 = 2 N_1=2 N1=2,则
H 1 ( X ) = − 0.6 l o g 2 0.6 − 0.4 l o g 2 0.4 l o g 2 2 = 0.97 H_1(X)=\frac{-0.6log_20.6-0.4log_20.4}{log_22}=0.97 H1(X)=log220.6log20.60.4log20.4=0.97
选取步长为2,则 Σ 1 = a b , b a \Sigma_1={ab,ba} Σ1=ab,ba N 1 = 2 N_1=2 N1=2,则
H 2 ( X ) = − 0.5 l o g 2 0.5 − 0.5 l o g 2 0.5 l o g 2 2 = 1 H_2(X)=\frac{-0.5log_20.5-0.5log_20.5}{log_22}=1 H2(X)=log220.5log20.50.5log20.5=1

2.随机性测度

NIST随机数测试标准
详见博客
这些方法可以检测01串是否是随机的。

3. 决策树

详见决策树-知乎

4.深度学习网络

4.1 CNN

详见深度学习-6.卷积神经网络CNN

4.2 自编码器

详见深度学习-10.自编码器

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值