自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 YOLOv8介绍

YOLOv8是Ultralytics推出的目标检测模型,在YOLOv5基础上进行了多项架构改进和性能优化。该模型采用无锚框设计,引入C2f模块替代C3模块优化特征提取,并采用解耦检测头提升分类与定位精度。YOLOv8支持目标检测、实例分割和姿态估计等多任务,提供n/s/m/l/x五种尺寸的预训练模型,在保持实时推理速度(30+FPS)的同时,平均精度(mAP)较YOLOv5提升10%-20%

2026-06-16 16:42:22 152

原创 YOLO算法简介

YOLO(You Only Look Once)是一种实时目标检测算法,将检测任务转化为单次回归问题,直接在图像上预测边界框和类别概率,具有高效快速的特点。YOLO的核心思想包括图像网格划分、边界框预测、单次前向传递和多任务损失函数。其流程涵盖输入处理、特征提取、预测输出和非极大值抑制。

2026-06-15 20:23:32 471

原创 电池拐点介绍

电池拐点是指电池性能曲线中出现的转折点,分为正常拐点和故障拐点。正常老化过程中会出现两个连续的拐点,分别对应SEI膜生长饱和和锂沉积等老化机制。故障拐点则是由过充、高温等异常条件引发,表现为电压突降、温度异常或内阻跳跃,可能导致电池性能急剧恶化甚至失效。

2026-06-12 20:09:14 362

原创 电池退化机理

电池性能退化主要由多种物理化学变化引起,包括正负极材料结构变化(如正极相变、过渡金属溶解,负极石墨剥落、硅膨胀)、SEI膜持续生长与破裂、电解液分解消耗、锂枝晶形成、集流体腐蚀以及粘结剂老化等。高温加速副反应,低温易诱发锂枝晶。这些因素共同导致容量衰减(活性锂损失、材料失效)、内阻增加(界面阻抗增大)和安全风险(枝晶短路、产气鼓胀)。

2026-06-11 15:13:48 350

原创 电池健康状态基础概念(简洁版)

系统阐述了电池健康管理的核心参数体系。主要内容包括:1)电池容量作为基础参数,包含额定容量和实际容量,其衰减是老化本质;2)SOH反映电池健康状态,通过容量或内阻计算,80%为退役阈值;3)RUL预测剩余使用寿命,分为循环型、时间型和里程型;4)C率作为关键工况特征,直接影响老化速度;5)温度是影响老化的首要外部因素,不同温区呈现差异化老化模式;6)Knee点标志老化从线性阶段进入加速阶段。

2026-05-27 18:45:13 519

原创 SSD(单发多框检测)

SSD(Single Shot MultiBox Detector)是一种高效的单阶段目标检测算法,通过单次前向传播同时预测目标类别和位置。其核心创新包括:1)基于多尺度特征图进行检测,利用不同层级特征识别不同尺寸目标;2)采用密集先验框(Anchor Boxes)机制,预设多种尺度和宽高比的候选框;3)将VGG16改造为全卷积网络,添加额外卷积层生成多尺度特征。相比两阶段检测器(如Faster R-CNN),SSD在保持较高精度的同时显著提升速度(TitanX上59FPS)。

2026-05-26 10:57:52 783

原创 R-CNN、Fast RCNN、Faster RCNN

本文系统介绍了目标检测领域三大经典算法的发展历程与技术演进。R-CNN开创性地将CNN引入目标检测,通过选择性搜索生成候选区域并独立提取特征,但存在计算冗余问题。Fast R-CNN通过共享卷积计算和RoI池化显著提升效率,实现端到端训练。Faster R-CNN则革命性地提出区域提议网络(RPN),将候选框生成整合进网络,形成完全端到端的检测流程。

2026-05-25 11:23:45 937

原创 VGG16猫狗二分类数据集处理

训练集文件夹命名为train,其中建立两个文件夹分别为cat和dog,每个文件夹里存放相应类别的图片。print(f"训练集:猫{len(train_cat)}张,狗{len(train_dog)}张")print(f"测试集:猫{len(test_cat)}张,狗{len(test_dog)}张")├── test/ # 测试集(从train中划分20%)│ ├── cat/ # 存放所有猫的图片。│ └── dog/ # 存放所有狗的图片。

2026-05-21 10:14:38 180

原创 VGG16猫狗二分类

VGG模型模型采用连续的3×3卷积核结构,在减少参数量的同时增强了非线性表达能力。在猫狗分类任务中,可使用Kaggle数据集,通过数据预处理(调整尺寸、归一化等)和VGG模型构建实现分类。

2026-05-21 10:13:29 492

原创 卷积层如何学习特征提取特征

卷积层学习特征:随机卷积核模板 → 扫描图像 → 算误差 → 反向传播修改模板 → 迭代后自动学会识别边缘、纹理、物体。1.随机初始化:网络刚搭建时,卷积核用高斯随机数初始化,和白噪声一样,对图像胡乱匹配。第 1 层卷积(浅层)——学习底层基础特征:水平 / 竖直边缘、角点、线条、简单色块。中间卷积层(中层)——学习纹理、简单形状:条纹、斑点、曲线、局部轮廓。用链式求导,算出每个卷积核每个位置的梯度(告诉卷积核哪里不对,往哪边改能减少误差):卷积核只看一小块区域,符合人眼看图像的方式(先看局部)。

2026-05-20 17:50:43 177

原创 VGG(VGG16/VGG19)

VGG网络核心创新在于通过堆叠小卷积核(3×3)来增加网络深度,提升图像识别性能。VGG16和VGG19是最著名的两个版本,分别包含16层和19层可训练权重层。VGG16采用13个卷积层+3个全连接层结构,通过5个block逐步压缩特征图尺寸;VGG19在此基础上增加了3个卷积层。

2026-05-20 15:43:17 1234

原创 AlexNet

AlexNet是采用5个卷积层和3个全连接层的8层架构。其创新包括:使用ReLU激活函数缓解梯度消失、Dropout正则化防止过拟合、局部响应归一化(LRN)和重叠池化。网络结构从224×224×3输入开始,经过多层卷积和池化后,最终输出1000维分类概率。

2026-05-19 15:15:16 345

原创 LeNet-5

LeNet-5网络包含7层结构(2个卷积层、2个池化层和3个全连接层),采用32×32灰度图像输入,通过卷积核提取特征,平均池化降维,最后通过全连接层分类。其关键技术包括局部感受野、权值共享和降采样,在MNIST数据集上达到99.2%准确率。LeNet-5奠定了现代CNN的基础,是首个成功商用的卷积神经网络。

2026-05-18 10:38:23 407

原创 神经网络(Neural Network, NN)

神经网络是一种模拟人脑神经元结构的计算模型,通过多层处理单元实现模式识别和预测分析。神经网络由输入层、隐藏层和输出层组成,通过前向传播计算输出,反向传播调整权重。核心组件包括神经元模型、激活函数(如Sigmoid、ReLU)和层级结构。

2026-05-15 10:39:26 518

原创 如何创建一个新的虚拟环境并在pycharm进行配置

例如:conda create -n unet-medical python=3.10 -y。conda create -n 环境名称 python=版本号 -y。,否则 PyCharm 会默认使用原来的环境,导致运行代码时找不到已安装的依赖。并打开(不要用普通 cmd,否则找不到 conda 命令)。创建完成后,必须激活环境才能安装依赖。(因为已经在 Anaconda 中创建好了环境)激活成功后,终端开头会显示。环境后,需要在 PyCharm 中。,表示当前处于该环境中。在弹出的窗口左侧,选择。

2026-05-13 11:11:34 248

原创 TCN(时域卷积网络)

TCN(时域卷积网络)是一种针对序列数据设计的卷积神经网络架构,通过因果卷积和膨胀卷积有效捕捉长期依赖关系。其核心特点包括:1)采用一维卷积和因果约束确保时序处理不丢失信息;2)利用膨胀卷积指数级扩大感受野;3)引入残差连接解决梯度问题。相比传统RNN,TCN具有并行计算能力强、训练效率高、能灵活处理变长序列等优势。

2026-04-15 15:27:19 744

原创 RNN(循环神经网络)

介绍了循环神经网络(RNN)的基本原理及其应用。RNN通过引入记忆机制处理序列数据(如自然语言、时间序列等),其核心特点是参数共享和隐藏状态的传递,使网络能够记住过去信息并用于当前计算。阐述了RNN的结构、输入输出形式以及多结构模式(如一对一、多对多等),同时指出标准RNN存在的长期依赖问题(梯度消失/爆炸)。最后介绍了改进方案LSTM和GRU,这些结构通过门控机制有效解决了长期记忆问题,成为处理序列任务的主流模型。

2026-04-13 17:20:13 516

原创 扩散模型的 MNIST 手写数字生成器

实现了一个基于扩散模型的手写数字生成系统。系统使用UNet作为去噪网络,通过前向扩散逐步添加噪声,再反向学习去噪过程。实验在MNIST数据集上训练,采用残差连接、注意力机制等技术提升模型性能。训练过程包含早停机制防止过拟合。

2026-03-30 11:33:54 80

原创 扩散模型(Diffusion Models)

扩散模型是一种深度生成模型,通过正向加噪和反向去噪过程实现数据生成。其核心是模拟物理扩散的逆向过程:从纯噪声逐步还原出清晰图像。模型包含两个马尔可夫链:前向扩散逐步添加高斯噪声,反向扩散学习去噪过程。训练目标是预测噪声的均方误差,数学推导显示其稳定性优于GAN和VAE。

2026-03-27 19:09:13 1116

原创 图像处理领域的掩码、可见性掩码、动态掩码

图像掩码是用于标记和处理图像特定区域的二值矩阵工具。主要类型包括:1)通用掩码(静态划分空间区域);2)可见性掩码(标记遮挡/不可见区域);3)动态掩码(随时间/场景自适应变化)。掩码可通过手动定义、自动生成或数据集标注获得,应用场景涵盖图像分割、目标检测、姿态估计等。掩码技术通过空间/时间维度的区域控制,为计算机视觉任务提供了灵活的像素级操作手段。

2026-03-26 18:59:14 374

原创 GAN(生成对抗网络)

生成对抗网络(GAN)是一种由生成器和判别器组成的深度学习模型,通过对抗训练实现图像生成等任务。生成器将随机噪声转换为合成数据,判别器则区分真实与合成数据。训练过程中,两者通过极小极大博弈相互优化:生成器试图欺骗判别器,判别器努力识别真假。本文以MNIST手写数字生成为例,介绍了GAN的模型结构、训练流程和代码实现,展示了从噪声到逼真图像的生成过程。实验结果表明,随着训练轮次增加,生成图像质量逐步提升。

2026-03-25 10:41:51 1274

原创 ResNet实现CIFAR10分类

使用ResNet-18模型在CIFAR-10数据集上进行图像分类的实现。ResNet通过残差块结构解决了深度网络退化问题,ResNet-18包含4个stage共18层。训练过程采用数据增强(随机裁剪、水平翻转)、SGD优化器和交叉熵损失函数,在135个epoch中实现了85%以上的分类准确率。

2026-03-23 10:02:55 282

原创 残差网络(ResNet)

残差网络(ResNet)是一种深度卷积神经网络,通过引入残差块和跳跃连接解决了深度网络训练中的梯度消失和退化问题。其核心思想是让网络学习输入与输出的残差映射而非完整映射,通过直连边实现恒等映射。残差块由卷积层和跳跃连接组成,当输入输出维度不一致时使用1x1卷积调整。ResNet包含多个残差阶段,特征图尺寸逐层减半而通道数翻倍。相比传统网络,ResNet能训练更深的网络(如100+层),在ImageNet等数据集上取得了显著性能提升。不同版本ResNet的主要区别在于残差块数量和类型。

2026-03-20 14:23:46 789

原创 VAE模型

变分自编码器(VAE)是一种改进的自编码器,通过引入概率编码解决了传统自编码器隐空间不连续的问题。VAE将输入数据编码为概率分布(均值和方差),采用重参数化技巧实现可微分采样,在损失函数中结合重构误差和KL散度约束隐变量分布。文中给出了基于MNIST数据集的PyTorch实现,展示了VAE在图像生成中的应用。

2026-03-19 18:12:35 554

原创 U-net图像分割实战

基于U-net架构的图像分割模型,主要包括训练和测试两个部分,并计算MSE、SSIM、Dice系数和IoU等多种评估指标来量化模型性能。

2026-03-18 11:14:55 86

原创 U-net网络

U-net 是一种的卷积神经网络 (CNN),特别适用于尤其是在医学影像分割领域取得了巨大成功。U-net是2015年发的论文,在U-net网络出现之前,普遍认为深度网络的成功训练需要数千个标注训练样本。所以,U-net这篇论文提出了如何利用少样本进行深度学习,效果还很不错。由于其网络形状像“U”,故被称为U-net。论文名字:U-net:Convolutional Networks for Biomedical Image Segmentation​。

2026-03-17 14:43:50 931

原创 MNIST数字识别(CNN)

使用卷积神经网络(CNN)实现数字识别分类方法。MNIST数据集(Modified National Institute of Standards and Technology)是一个手写数字图像数据集,包含60,000张训练图像和10,000张测试图像,每张图像为28x28像素的手写数字灰度图,标签为 0-9 的数字。

2026-03-16 15:16:35 876

适用YOLO口罩检测数据集

适用于YOLO口罩检测的数据集

2026-06-11

目标检测 yolo口罩检测

Yolo口罩检测 ultralytics-main

2026-06-11

基于YOLO 疲劳驾驶检测

YOLO疲劳驾驶检测系统

2026-06-11

NASA锂电池数据集(CSV版)

提供了一个名为“nasa电池数据b5,b6,b7,b18 csv版”的资源文件,该文件包含了NASA Ames研究中心提供的锂电池实验数据集。数据以CSV格式存储,适用于锂电池寿命预测相关的研究和开发工作。

2026-05-27

Brain Tumor Segmentation Dataset

Brain Tumor Segmentation Dataset 是专用于医学图像语义分割的数据集,旨在精准识别脑肿瘤区域。该数据集包含两类标注(肿瘤/非肿瘤),通过像素级分类实现肿瘤区域的细粒度分割,适用于训练和评估医学影像分割模型,为脑肿瘤诊断提供自动化分析支持。

2026-05-12

猫-狗数据集 cat-dog

猫-狗数据集 cat-dog

2026-05-12

扩散模型 MNIST手写数字

扩散模型 MNIST手写数字

2026-03-30

Diffusion models

Diffusion models

2026-03-30

cifar-10 数据集

CIFAR-10 是一个常用于计算机视觉任务的小型图像数据集,包含 60000 张 32x32 的彩色图像,分为 10 个类别,每类有 6000 张图像。数据集分为 50000 张训练图像和 10000 张测试图像,适合用于深度学习模型的训练和测试。

2026-03-18

Unet图像分割-汽车

Unet图像分割-汽车

2026-03-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除