【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—更新(正式比赛)

【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—更新(正式比赛)

往期链接:

【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—解题全流程(持续更新)
【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—解题全流程(论文更新)

全家桶更新内容:

全部代码,制作数据、训练权重,结果,视频:

在这里插入图片描述

其中,LXS文件夹,代表所有的jupyter代码以及Chinese clip模型代码,基于服务器就可以直接运行,(找我分享服务器镜像,不用再配置环境了)

视频为边做边录制,全程记录训练预测、验证过程。

在这里插入图片描述

全家桶获取

可以微信:zgr421136咨询 (微信优惠-5)
可以QQ交流群:458351399

可以直接爱发电平台:
https://afdian.net/item/8cc7f3dae8d111eeb7b05254001e7c00

良心制作,质量保证,售后解答。

单品一:

单品一包含全套代码(找我分享服务器镜像,无需配置环境,一键运行),教程视频,训练的权重与提交结果
获取链接:

https://afdian.net/item/e579256ceead11ee9b7352540025c377

单品二:

单品二包含需要提交结果(28号的提交测试结果csv也会更新)与完结论文
获取链接:

https://afdian.net/item/4a9d076aeeae11ee908b52540025c377

训练、预测展示:

训练,

(基于小的base16,预训练权重模型训练的,4w条为训练集,1w条为验证集)

只训练了44轮,一轮训练花费15分钟,显存只占6GB左右。

在这里插入图片描述

预测结果:

说明:这是训练了44轮,验证效果不算太理想的第一版模型的预测结果。

(对问题二,文本预测检索图片,问题三,图片预测检索文本的部分结果展示),此时验证集的召回验证recall@k5值为60。

在这里插入图片描述

在这里插入图片描述

图片检索文本结果部分展示:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

后续计划:

今晚将进行选择最大最全面的中文预训练模型,对正式数据再进行训练(很费时间,很费资源。本地电脑是一定搞不了的,或服务器或者学校实验室服务器。)

  1. 选择最大预训练权重文件进行训练
  2. 训练50轮
  3. 论文编写改进方向优化指导.txt

第二版更新将直接上传售后群qq文件夹里,以及百度网盘链接的方式。

【标】第十届泰迪数据挖掘挑战赛B是一个以数据分析和挖掘为核心的竞赛项目,参赛者需要通过解决一系列问来展示他们的技能和创新思维。这个压缩包包含了参赛者对B的完整解答以及实现这些解答的源代码。 【描述】这个描述简单明了,表明压缩包中的内容是关于“第十届泰迪数据挖掘挑战赛”的B解决方案。"完整解及代码"意味着文件中不仅有分析思路和方法论,还有实际的编程实现,这对于学习数据挖掘和机器学习的初学者或爱好者来说是非常宝贵的资源。 【标签】虽然没有提供具体的标签,但我们可以根据标和描述推断出一些关键标签,如“数据挖掘”、“数据分析”、“机器学习”、“Python编程”、“挑战赛”、“比赛策略”。 【压缩包子文件的文件名称列表】 1. 第一问第一小问.zip:这可能是参赛者对B第一部分的第一小问的解答和代码,可能涉及到数据预处理、探索性数据分析(EDA)和初步模型构建。 2. 第一问第二小问.zip:这涵盖了第一部分的第二个问,可能涉及更复杂的数据建模、特征工程或者模型优化。 3. 第二问第一小问.zip:这是针对B第二部分的第一个问,可能涉及到不同的数据挖掘任务,如分类、聚类或预测。 4. 第二问第二小问.zip:对应第二部分的第二个问,可能需要参赛者进行更深入的分析,如异常检测、关联规则学习或者时间序列分析。 5. 问二-异常时间点分析 (1).ipynb:这是一个Jupyter Notebook文件,专门针对问二中的异常时间点分析,可能包含了数据可视化、统计测试和异常检测算法的实现。 综合以上信息,我们可以了解到这个压缩包是围绕数据挖掘挑战赛的解过程,涉及到多个阶段的问解决,涵盖数据预处理、建模、模型评估和异常检测等核心步骤。参赛者可能使用了Python等编程语言,利用了如Pandas、Numpy、Scikit-learn等库进行数据分析和建模。通过研究这些文件,学习者可以深入理解如何在实际问中应用数据挖掘技术,并且能学习到如何组织和呈现一个完整的数据挖掘项目。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

葡萄成熟时_

谢谢您,祝您生活愉快,所想及得

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值