网络流数据集处理（深度学习数据处理基础）

Yorelee.

已于 2024-03-10 22:44:31 修改

阅读量615

点赞数 9

分类专栏： # 环境配置文章标签：深度学习人工智能

于 2024-02-01 14:51:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_63997099/article/details/135973685

版权

环境配置专栏收录该内容

12 篇文章 0 订阅

订阅专栏

本文介绍了数据集的预处理流程，包括从网络流数据转换为Json格式，划分训练集和测试集。后门攻击训练详细描述了有监督学习过程，涉及批次处理、随机投毒目标选择以及正常样本的训练策略。

摘要由CSDN通过智能技术生成

一、数据集处理

处理数据集是一个文件夹一个文件夹处理的，将原网络流数据集放入一个文件夹处理转换成 Json文件。（数据预处理）然后将这些文件处理成目标文件格式再分割成训练集和测试集。每次运行只会处理一个文件夹。

运行train.py 导入训练集训练模型，训练完之后进行保存模型参数。
运行test.py 导入测试集测试模型，因此我们需要使用模型参数保存代码。

如果我们需要将数据集4倍交叉验证分为4个部分，3个训练集，一个测试集。那就相当于运行三次train.py分别运行导入不同的三个训练集即可。如果每个部分都需要当做一次测试集，那就重复4次就行。

二、后门攻击训练

为了进行有监督训练，我们需要带有标签的数据集。

我们认为数据集是带有标签的，

训练这里分为几个步骤：

将训练集每64个网络流当做一个批次。

（1）选择一个投毒目标yt，在当前训练集批次中随机选择20%个投毒目标，进行以下处理：

上一次网络流+当前网络流生成触发器掩码m
当前网络流与掩码的m[n+1,2n]相加，训练模型分类为目标类别yt

（2）对于不投毒的训练集，用正常标签训练。

关注

9
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
网络流数据集处理（深度学习数据处理基础）

处理数据集是一个文件夹一个文件夹处理的，将原网络流数据集放入一个文件夹处理转换成 Json文件。（数据预处理）然后将这些文件处理成目标文件格式再分割成训练集和测试集。每次运行只会处理一个文件夹。如果我们需要将数据集4倍交叉验证分为4个部分，3个训练集，一个测试集。那就相当于运行三次train.py分别运行导入不同的三个训练集即可。如果每个部分都需要当做一次测试集，那就重复4次就行。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Yorelee. 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。