SeLeCT：Self-Learning Classifier for Internet Trafﬁc

xieqb

于 2014-12-09 17:55:14 发布

阅读量668

点赞数

分类专栏：机器学习文章标签：流量分类迭代聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xieqb/article/details/41826437

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

4.实验结果

A、实验数据集

B、性能评估

用2个度量准则对聚类迭代算法的输出进行评估，聚类的个数以及被聚类流的百分比。

用混淆矩阵对分类结果进行说明，混淆矩阵的每一行的代表分类的实际结果，每一列代表实际的分类结果。对性能进行评估时，采用以下三个度量标准：总体精度，召回，精度。

总体精度并不能完全评估分类的能力，如果一个trace里面有90%的流为HTTP，讲所有的流都归为HTTP，其总体精度也将达到90%。

召回是针对每一个具体的来来说，上面的例子中，除了HTTP外，其它召回率均为0。

精度的结果同上。

%%%%%%%%%%%%%%说明%%%%%%%%%%%%%%

假定：从一个大规模数据集合中检索文档的时，可把文档分成四组：

- 系统检索到的相关文档（A）

- 系统检索到的不相关文档（B）

- 相关但是系统没有检索到的文档（C）

- 不相关且没有被系统检索到的文档（D）

则：

- 召回率R：用检索到相关文档数作为分子，所有相关文档总数作为分母，即R = A / ( A + C )

- 精度P：用检索到相关文档数作为分子，所有检索到的文档总数作为分母．即P = A / ( A + B ).

%%%%%%%%%%%%%%说明%%%%%%%%%%%%%%

文中其它参数的设置如下:

批处理包的大小为10000；种子个数为8000，聚类中流的阈值为20，迭代次数为3，迭代次数小于3时端口过滤阈值为0.5，最终端口过滤阈值为0.2，聚类算法中，K=100，总的迭代步数小于1000000，独立执行10次，选择均方误差最小的值作为聚类结果。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SeLeCT：Self-Learning Classifier for Internet Trafﬁc

4.实验结果A、实验数据集B、性能评估用2个度量准则对聚类迭代算法的输出进行评估，聚类的个数以及被聚类流的百分比。用混淆矩阵对分类结果进行说明，混淆矩阵的每一行的代表分类的实际结果，每一列代表实际的分类结果。对性能进行评估时，采用以下三个度量标准：总体精度，召回，精度。总体精度并不能完全评估分类的能力，如果一个trace里面有90%的流为HTTP，讲所有的流都归为HTTP，其总
复制链接

扫一扫

专栏目录

xieqb CSDN认证博客专家 CSDN认证企业博客

码龄17年

19: 原创

31万+: 周排名

172万+: 总排名

6万+: 访问

: 等级

962: 积分

30: 粉丝

0: 获赞

8: 评论

15: 收藏

私信

关注

热门文章

分类专栏

机器学习 3篇
Linux 1篇
FFmpeg 1篇
libjpeg 1篇
TensorFlow

最新评论

libjpeg.h文件
shaoxiaofei3: 写的是神马啊。。。
libnids抓不到包
青儿哥哥: 我也折腾了好长时间。不知道为什么计算了校验和就抓不到包呢？？求大神解释。。。
libnids抓不到包
流河旱树: 牛逼，解决了我压抑一下午的问题！
QQ2013 协议分析
liqiangda1991: 我自己依靠网上的资料写的解密算法。在解密你的第一个包时，前16字节解密正确，之后就不一样了。能不能给我你的解密算法，或者是交织部分的算法？
QQ2013 协议分析
爱搬砖的摄影师: xxx,刚准备订阅这个博客的，才发现原来这个是你这二货的。。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。