【科研】ET-BERT资料库梳理

Luck66Max

已于 2023-01-30 15:05:02 修改

阅读量2k

点赞数 5

分类专栏：科研文章标签：深度学习人工智能

于 2023-01-30 12:01:31 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41581765/article/details/128799921

版权

科研专栏收录该内容

2 篇文章

订阅专栏

作者原repo链接

https://github.com/linwhitehat/ET-BERT

0.资料总库

分为数据+模型+语料库
在这里插入图片描述

1.数据集

包含fine-tuning数据集（cstnet-tls 1.3）与公开数据集（USTC-TFC、VPN-app、VPN-service的数据包级和流级）目录链接
在这里插入图片描述

1.1 微调-数据集组成

即fine-tuning_dataset目录下的数据集，fine-tuning的数据集是tsv的
在这里插入图片描述

1.2 预训练-数据包级-组成

即Open-Datasets目录下的数据集
在这里插入图片描述

1.3 预训练-流级-组成

即Open-Datasets\flow-level目录下的数据集
在这里插入图片描述

1.4 预训练-组成(不在总资料库的数据集)

这部分应该是预训练使用的数据集（不太确定，等我看看代码先:(

cstnet-tls 1.3 dataset
下面是cstnet-tls 1.3 dataset的label：
在这里插入图片描述
该数据集包含两个压缩文件，一个是flow级别的，另一个是packet级别的：

以flow_dataset为例：
CSTNET-TLS 1.3的流级别的数据集

该数据集有120个类别
每个类别有500个样本
数据部分以x_开头，标签部分以y_开头
有5种数据类型，包括direction, length, message type, time and datagram
不同的数据文件分别被划分为train, test, valid三种

在这里插入图片描述

2. corpora（语料库）

语料库
在这里插入图片描述

3. 模型

预训练模型
在这里插入图片描述

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。