【工作复盘2】2025年4月8日

今日工作复盘文档

今天的复盘主要总结了两方面的工作内容:图像分类模型的调整和加密流量分类的论文阅读。在图像分类部分,我基于ResNet-50模型进行了全参数训练和微调实验;在论文阅读部分,我整理了近三年的相关文献,并开始深入阅读《ET-BERT》这篇论文。本文档将详细回顾今日工作内容,分析实验结果,并提出指导意见,以明确后续改进方向。


图像分类模型调整

工作内容
  • 全参数训练:基于预训练的ResNet-50模型,对所有参数进行训练,训练时长15个epoch。
  • 微调:冻结ResNet-50模型的大部分层,仅对最后五层进行微调,训练时长5个epoch。
实验结果
  • 全参数训练
    • 训练集准确率从0.5700提升至0.8813,loss从1.1310下降至0.3307。
    • 验证集准确率从0.6957提升至0.9130(Epoch 4后趋于稳定),val_loss从0.5013下降至0.2770。
  • 微调
    • 训练集准确率从0.6513提升至0.9640,loss从0.9736下降至0.1201。
    • 验证集准确率从0.7826提升至0.8261(Epoch 2达到峰值),随后下降至0.6522,val_loss从0.4722上升至1.0207。
分析与指导意见
  • 全参数训练
    • 分析:模型表现良好,验证集准确率稳定在0.9130,val_loss持续下降,表明模型有效学习了数据特征且泛化能力较强。训练集准确率低于验证集,可能与数据量较小或训练集与验证集分布差异有关。
    • 指导意见
      1. 数据增强:通过旋转、翻转、缩放等技术增加训练数据的多样性,提升模型对训练集的拟合能力。
      2. 学习率调整:尝试降低学习率(如从0.001降至0.0001),进一步优化loss。
      3. 早停策略:在val_loss下降变缓时停止训练,避免资源浪费。
  • 微调
    • 分析:训练集准确率提升显著,但验证集准确率在Epoch 2后下降,val_loss上升,表明模型过拟合。可能原因包括学习率过高、冻结层数过多或数据量不足。
    • 指导意见
      1. 降低学习率:使用更小的学习率(如0.0001),缓慢调整参数,避免破坏预训练权重。
      2. 解冻更多层:尝试解冻更多层(如最后10层),提升模型表达能力。
      3. 正则化:在最后几层加入dropout(0.3-0.5)或L2正则化,减少过拟合。
      4. 缩短微调epoch:在val_loss上升前停止训练(如Epoch 2或3)。

论文阅读

工作内容
  • 论文整理:整理了近三年CCF A类会议和期刊中与加密流量分类相关的论文,包括《Bottom Aggregating, Top Separating》、《MIETT》、《TrafficFormer》、《Yet Another Traffic Classifier》、《MT-FlowFormer》和《ET-BERT》。
  • 论文阅读:开始阅读《ET-BERT》,已完成Abstract、Introduction和Related Work部分的阅读。
理解总结
  • 背景:《ET-BERT》基于《PERT》改进,针对后者预训练未优化加密流量数据的不足。
  • 改进目标
    • 预训练任务:设计了两个预训练任务,考虑流量传输的结构模式和数据包载荷的双向关联。
    • 微调策略:提出了两种微调策略,以适应加密流量分类任务。
指导意见
  • 后续阅读重点
    1. 预训练任务的具体设计
      • 明确“流量传输的结构模式”和“载荷的双向关联”的定义。
      • 分析预训练任务如何编码这些特性,是否引入领域知识。
    2. 微调策略的实现
      • 理解两种微调策略的区别及其适用场景。
      • 分析微调如何利用预训练特征,是否结合流量元数据。
    3. 数据与实验验证
      • 关注数据集、评估指标及与《PERT》等baseline的对比结果。
  • 研究启发
    • 探索在预训练中进一步挖掘流量数据特性(如TLS握手中的明文信息、包间隔时间)。
    • 根据任务需求(如实时分类 vs 离线分析)调整微调策略,提升实用性。

结论

今日工作在图像分类模型调整和论文阅读方面均取得进展。图像分类实验表明全参数训练效果优于微调,后续需通过数据增强和正则化进一步优化模型;论文阅读为加密流量分类研究提供了理论基础,后续需深入分析《ET-BERT》的技术细节并结合实验验证。未来工作将围绕模型优化和领域知识融合展开,以提升研究成果的实用性。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值