云中有鹤565-CSDN博客

原创 Datawhile 组队学习Tiny-universe Task01

LLaMA模型的开源策略不仅推动了AI技术的普及和创新，也为广大开发者提供了宝贵的研究资源，加速了AI技术的商业化进程，并促进了多模态、多语言技术的发展。随着技术的不断进步和应用场景的不断拓展，LLaMA模型预计将在更多领域发挥重要作用，为人类社会带来更加智能、便捷的生活体验。

2024-09-19 21:52:23 1115

原创 Datawhale AI夏令营第五期 CV方向 Task3笔记

数据增强是机器学习和深度学习中的一种技术，通过在原始数据集上应用一系列变换来人工地增加数据样本的数量和多样性，从而提高模型的泛化能力，减少过拟合，并通过模拟不同的数据变化来增强模型对新数据的适应性。这些数据增强方法可以单独使用，也可以组合使用，以提高模型对各种变化的适应能力和泛化能力。这些库都是数据科学和机器学习领域中常用的工具，它们可以帮助研究人员和开发人员通过自动化的方式生成大量多样化的训练数据，从而提高模型的性能和泛化能力。

2024-08-31 17:23:45 1031

原创 Datawhale AI夏令营第五期 CV方向 Task2笔记

YOLO（You Only Look Once）是一种流行的目标检测算法，于2015年首次提出。YOLO的核心思想是将目标检测任务转化为一个回归问题，通过单个卷积神经网络（CNN）直接从图像中预测边界框（bounding box）和类别概率。YOLO算法以其速度快和性能好而著称，特别适合实时目标检测任务。YOLO算法的网络结构受到了GoogLeNet的启发，包含24个卷积层和2个全连接层，其中使用了1×1的卷积层来代替GoogLeNet中的inception模块。

2024-08-29 22:54:19 1139 1

原创 Datawhale AI夏令营第五期 CV方向 Task1笔记

这份赛题描述为参赛者提供了一个明确的研究方向和目标，即开发一个能够自动检测城市管理中违规行为的智能系统。这不仅有助于提升城市管理的智能化水平，也为参赛者提供了展示其技术能力的平台。参赛者需要具备图像处理和计算机视觉方面的知识，以及算法开发和数据分析的能力。

2024-08-26 23:30:46 768

原创小波卷积：为计算机视觉任务开辟新的参数效率之路

论文成功地利用小波变换（WT）提出了WTConv层，这是一种新的CNN层，能够在不大幅增加参数的情况下显著增加感受野。WTConv层通过在小波域中进行卷积操作，实现了对输入数据的多频率响应，这使得网络能够更好地捕捉低频信息，从而提高了对形状的敏感性，并增强了网络的鲁棒性。实验结果表明，WTConv层在多个视觉任务中都取得了性能提升，证明了其有效性。

2024-08-24 11:07:44 10048 3

原创 Datawhale X 魔搭 AI夏令营第四期魔搭-AIGC文生图方向Task3笔记

ComfyUI是一个功能强大、高度模块化的Stable Diffusion图形用户界面和后端系统，它允许用户通过链接不同的节点来构建复杂的图像生成工作流程。这些节点可以包括各种任务，如加载检查点模型、输入提示、指定采样器等。ComfyUI的用户手册提供了全面的指南，帮助用户快速入门并深入探索ComfyUI的功能。

2024-08-16 23:17:29 1043

原创 Datawhale X 魔搭 AI夏令营第四期魔搭-AIGC文生图方向Task2笔记

文字描述中提到的是一个“文静的中国女学生”，坐在明亮的教室里，专注地看着黑板，上半身穿着整齐的校服，手中拿着笔记本。这个回答介绍的代码的总体逻辑，从安装的必要库开始，逐步介绍了如何准备数据集、筛选数据、训练LoRA模型，以及如何生成和处理图像。除此之外，他还指出了代码在运行过程中可能会出现的一些问题点，并且提出合理的修改建议，有利于学习者更好的了解这份代码的具体逻辑。这样的结果表明，我们的模型在生成符合描述的图片方面表现良好，可以说是相当成功的。的文件夹，并将数据集中的每一张图片保存到该文件夹下。

2024-08-14 17:10:48 757 1

原创 SCConv：一种减少CNN计算负担的创新方法

总结部分强调了SCConv模块的两个主要贡献：空间重构单元（SRU）和通道重构单元（CRU），它们通过减少特征图的空间和通道冗余，显著提高了模型性能，同时降低了计算负载。SCConv作为一个高效的、可即插即用的架构单元，能够轻松集成到各种CNN架构中，无需对现有模型架构进行调整。广泛的实验结果表明，与现有的最先进方法相比，SCConv嵌入的模型在图像分类和目标检测任务中提供了更好的性能与效率之间的权衡。作者希望这项工作能够激发更多关于高效CNN架构设计的研究。

2024-08-11 10:50:05 1798

原创 Datawhale X 魔搭 AI夏令营第四期魔搭-AIGC文生图方向Task1笔记

参赛者可以自由定义故事的内容，但需要确保故事的连贯性和吸引力。

2024-08-07 16:10:00 1261

原创 Datawhale AI 夏令营：从零入门 AI for Science（AI+气象）----Task 2

新baseline相较于原始baseline，在数据处理、模型初始化、训练监控和超参数调整方面进行了优化。这些改进有助于提高模型的训练效率和预测性能，从而在竞赛中取得更好的成绩。数据集加载的改进减少了因时间戳不匹配导致的数据丢失问题。增加验证集dataloader有助于实时监控模型在未见数据上的表现。Xavier初始化方法有助于模型更快地收敛到较好的拟合状态。验证集损失的监控为选择更好的模型提供了依据。超参数的调整则进一步优化了模型的训练过程。

2024-08-03 21:57:03 892

原创深入探索EPSA：提升卷积神经网络性能的新式注意力模块

摘要部分提出了一种新的注意力模块——金字塔分割注意力（PSA）模块，该模块通过替代ResNet瓶颈块中的3x3卷积，显著提升了模型性能。PSA模块能够作为即插即用组件，增强网络的多尺度表征能力，使EPSANet在多个计算机视觉任务上超越了现有的通道注意力方法。结论部分总结了PSA模块的优势，它能够提取丰富的多尺度空间信息，并在通道注意力向量中捕捉跨维度的重要特征。EPSA块通过增强多尺度表征能力和长距离通道依赖性，提高了网络性能。EPSANet在各种计算机视觉任务上都取得了优异的成绩，证明了其有效性。

2024-08-03 10:26:07 1626

原创 Datawhale AI 夏令营：从零入门 AI for Science（AI+气象）----Task 2

最后，使用训练好的模型对新数据进行预测和推理。总结来说，MetNet模型的训练损失和验证损失随着训练周期的增加呈现稳定下降趋势，两者均从0.85左右开始下降，训练损失逐渐降至0.60左右，而验证损失也表现出类似的下降模式，最终接近训练损失的水平。：最终，训练损失和验证损失都达到了0.60左右，可以认为模型在训练集和验证集上都获得了相似的性能，这通常是一个良好的信号，表示模型泛化能力较强。同时，训练损失和验证损失都在持续减少，表明模型性能在提升，应尝试加大训练的次数，以获得更佳的模型效果。

2024-08-01 00:02:41 711

原创探索Squeeze-and-Excitation Networks的革新与应用

Squeeze-and-Excitation（SE）模块是一种用于提高卷积神经网络（CNN）性能的网络结构组件。它的核心思想是通过显式地对网络中的通道特征进行重新加权，来增强网络对有用特征的响应，并抑制无关的特征。SE模块的引入旨在解决传统CNN中特征表示能力不足的问题，尤其是在深层网络中。论文的摘要部分概述了卷积神经网络（CNN）的核心构建模块——卷积算子，并指出了其在构建信息特征方面的重要性。

2024-07-31 10:57:46 1431

原创 Datawhale AI 夏令营：从零入门 AI for Science（AI+气象）----Task 1

天气预报和降水预测听起来像是高难度的技术活，但其实在人工智能时代，这些任务已经变得相对容易。通过收集大量的气象数据，比如温度、湿度、气压、风速等，我们可以使用数据分析和深度学习技术来构建预测模型。具体来说，首先需要收集和整理历史气象数据，然后通过数据预处理，比如清洗、归一化等步骤，让数据更适合模型训练。接下来，选择合适的深度学习模型，比如卷积神经网络(CNN)、循环神经网络(RNN)或者长短期记忆网络(LSTM)等，来学习数据中的模式和规律。

2024-07-28 22:34:57 1005

原创 YOLOv10：实时端到端目标检测模型研究

YOLO（You Only Look Once）是一种流行的实时目标检测算法，由Joseph Redmon等人在2015年首次提出。它的核心思想是将目标检测任务看作一个单一的回归问题，通过一次前向传播即可预测出图片中的目标类别和位置。YOLO算法以其速度快、性能好而受到广泛关注，并且已经发展出了多个版本。YOLOv10是由清华大学研究团队开发的最新一代实时端到端目标检测模型。它在YOLO系列模型的基础上，通过引入一致的双重标签分配策略和全面效率-准确性驱动的模型设计，显著提升了检测性能和效率。

2024-07-25 10:42:28 2032

原创 Datawhale AI 夏令营：从零入门CV图像竞赛(Deepfake攻防)----Task 3

原任务地址：https://datawhaler.feishu.cn/wiki/Ad0jwNK8Eis5XwksFZ7cCvb6nHh数据增强是深度学习中的一种技术，它通过改变训练数据的形态来增加数据的多样性。这样做可以帮助模型学习到更多的特征，从而在面对真实世界中不同的场景时，能够更好地进行泛化。在参加比赛或者实际应用中，一个巧妙的数据增强策略往往能够显著提高模型的准确率，成为取得好成绩的关键因素。简而言之，数据增强通过让模型见识到更多的数据变化，帮助它在面对未知数据时也能保持较高的识别能力。数据增强基础

2024-07-20 23:24:16 849

原创 Datawhale AI 夏令营：从零入门CV图像竞赛(Deepfake攻防)----Task 2

任务目标是：开发一个基于深度学习的Deepfake检测模型。这个实践项目将涵盖从数据集准备、模型训练到性能评估的各个环节，全面展示如何利用深度学习技术检测Deepfake内容。学到的内容包括：

2024-07-17 22:36:24 938

原创 Datawhale AI 夏令营：从零入门CV图像竞赛(Deepfake攻防)----Task 1

Deepfake 是利用人工智能和生成对抗网络技术，将一个人的面部特征或声音替换为另一个人的合成媒体。它在电影制作、教育和艺术创作中有广泛应用，但也带来了传播假信息和侵犯隐私的风险。识别 Deepfake 的方法包括观察面部细节和嘴唇同步，以及分析语音和光照的自然性。在实施基线模型（如 ResNet-18）的训练和验证时，关键步骤包括数据预处理、模型定义、损失函数选择、训练与验证过程，并使用准确率评估模型性能。

2024-07-14 22:10:31 944 1