网络流数据集处理(深度学习数据处理基础)

本文介绍了数据集的预处理流程,包括从网络流数据转换为Json格式,划分训练集和测试集。后门攻击训练详细描述了有监督学习过程,涉及批次处理、随机投毒目标选择以及正常样本的训练策略。
摘要由CSDN通过智能技术生成

 一、数据集处理

处理数据集是一个文件夹 一个文件夹处理的,将原网络流数据集 放入一个文件夹 处理转换成 Json文件。(数据预处理)然后将这些文件处理成目标文件格式 再分割成训练集和测试集。每次运行只会处理一个文件夹。

  • 运行train.py 导入训练集训练模型,训练完之后进行保存模型参数。e2a33e73d1f34589b845bb82fa103850.png
  • 运行test.py 导入测试集测试模型,因此我们需要使用模型参数保存代码。

如果我们需要将数据集4倍交叉验证分为4个部分,3个训练集,一个测试集。那就相当于运行三次train.py分别运行导入不同的三个训练集即可。如果每个部分都需要当做一次测试集,那就重复4次就行。

a6bd5d0e88cd44339ce8782532a06fa9.png

二、后门攻击训练

为了进行有监督训练,我们需要带有标签的数据集。

我们认为数据集是带有标签的,

训练这里分为几个步骤:

将训练集每64个网络流当做一个批次。

(1)选择一个投毒目标yt,在当前训练集批次中随机选择20%个投毒目标,进行以下处理:

  • 上一次网络流+当前网络流生成 触发器掩码m
  • 当前网络流 与 掩码的m[n+1,2n]相加,训练模型分类为目标类别yt

(2)对于不投毒的训练集,用正常标签训练。

 

 

  • 9
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
购买力分类数据集是指根据人们的购买力水平将他们分为不同的群体或类别的数据集。这些数据可以用于市场研究、个性化推荐、精准营销等领域。 AI深度学习可以用于对购买力分类数据集的分析和挖掘。通过使用深度学习算法,可以从海量的数据中提取出隐藏在其中的有用信息和模式,从而帮助企业更好地了解和预测不同购买力群体的消费行为。 首先,深度学习可以通过对购买力分类数据集进行特征提取和降维,找出影响购买力的主要因素。例如,可以通过训练神经网络来自动学习和识别购买力与年龄、性别、收入、教育水平等因素之间的关系。 其次,深度学习可以构建购买力分类模型,通过学习数据集中的模式和规律来预测新数据的购买力。例如,可以使用循环神经网络(RNN)来处理时间序列数据,预测某个用户未来的购买力变化趋势。 此外,深度学习还可以用于购买力分类数据集的聚类和分群。通过将购买力相似的用户聚类在一起,可以更好地进行市场细分和针对性推荐。例如,可以使用自编码器(Autoencoder)等无监督学习方法,将购买力相似的用户归为一类,并为他们提供个性化的产品推荐。 综上所述,购买力分类数据集的AI深度学习分析可以帮助企业更好地理解和预测不同购买力群体的消费行为,从而制定更有效的营销策略和个性化推荐方案。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Yorelee.

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值