自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

穿着帆布鞋也能走猫步

不要让你的梦想沦为空想。

  • 博客(154)
  • 资源 (9)
  • 收藏
  • 关注

原创 基于DETR模型实现交通标志检测

交通标志检测在自动驾驶和交通监控中是一个重要的问题。目标检测技术极大地促进了这一过程的自动化。

2024-08-14 18:18:37 103

原创 使用自己的数据集训练DETR模型

本文将使用四个预训练的DETR模型(DETR ResNet50、DETR ResNet50 DC5、DETR ResNet101和DETR ResNet101 DC5)在自定义数据集上对其进行微调,通过比较它们在自定义数据集上的mAP,来比较评估每个模型的检测精度。

2024-05-17 15:27:03 285

原创 基于Multiscale Vision Transformer的视频动作识别

本文基于Multiscale Vision Transformer进行视频动作识别,并附录完整代码。

2024-04-18 17:20:01 477 1

原创 三万字长文超详细解读LLama2!

自从Transformer架构问世以来,大型语言模型(Large Language Models, LLMs)以及AIGC技术的发展速度惊人,它们不仅在技术层面取得了重大突破,还在商业应用、社会影响等多个层面展现出巨大潜力。随着ChatGPT的推出,这一技术日益走进大众视野,这也预示着一个由生成式AI塑造的未来正在加速到来。与此同时,Meta AI Meta AI在2023年推出了LLama(Large Language Model Meta AI)系列大语言模型,这一模型初期是以较为封闭的形式面向特定

2024-04-18 11:51:40 2688

原创 一文搞懂Tokenization

语言模型是对文本进行推理,文本通常是字符串形式,但是模型的输入只能是数字,因此需要将文本转换成数字形式。Tokenization是NLP的基本任务,按照特定需求能把一段连续的文本序列(如句子、段落等)切分为一个字符串序列(如单词、短语、字符、标点等多个单元),其中的元素称为token或词语。具体流程如下图所示,首先将文本句子切分成一个个单元,然后将子单元数值化(映射为向量),再将这些向量输入到模型进行编码,最后输出到下游任务进一步得到最终的结果。

2024-04-11 17:32:29 871

原创 使用Pytorch从零实现Transformer模型

2017年Google在论文《Attention is All You Need》中提出了Transformer模型,并成功应用到NLP领域。该模型完全基于自注意力机制Attention mechanism实现,弥补了传统的RNN模型的不足。本文笔者将详解使用Pytorch从零开始逐步实现Transformer模型。

2024-04-10 10:31:54 2453 2

原创 大概是最全的开源大模型LLM盘点了吧!

LLM(Large Language Model, 大型语言模型)是指那些规模庞大、参数数量众多的深度神经网络模型,用于理解和生成自然语言文本。在自然语言处理(NLP)领域有着广泛的应用,因其强大的语言理解和生成能力,能够处理各种复杂的文本任务,包括但不限于翻译、问答、文本摘要、对话、文本分类、情感分析、代码生成、创作辅助等。LLM主要基于Transformer架构,该架构由Vaswani等人在2017年的论文《Attention is All You Need》中提出。

2024-04-10 10:24:05 1870

原创 超详细解读Transformer框架

首先我们先对Transformer来个直观的认识。Transformer出现以前,NLP领域应用基本都是以RNN或LSTM循环处理完成,一个token一个tokrn输入到模型中。模型本身是一种顺序结构,包含token在序列中的位置信息。会出现梯度消失现象,无法支持长时间序列。句子越靠后的token对结果的影响越大。只能利用上文信息,无法获取下文信息。循环网络逐个token输入,也就是句子有多长就要循环多少遍,计算的效率低。而Transformer的出现得以解决了上述的一系列问题。

2024-04-09 12:13:14 2029

原创 一文搞懂NLP框架之RNN、LSTM、Transformer结构原理!

NLP领域中,特征提取可谓是经历了显著的“变迁”与发展。回首过往,RNN曾以其一度引领潮流,如今正如同明日黄花,逐步淡出历史舞台。紧接着,LSTM以展现出强大的生命力,虽已非最前沿,却仍老骥伏枥,若能进一步优化,其潜力不可小觑。而今,Transformer架构如日中天,凭借自注意力机制彻底革新了特征提取的方法,已在NLP诸多任务中发挥着中流砥柱的作用。本文笔者将深入浅出剖析RNN、LSTM以及Transformer的核心结构原理,一起见证算法是怎样做到一浪更比一浪强的。

2024-04-09 11:56:53 3064

原创 【C语言】病人信息管理系统

本设计实现了一个病人信息管理系统,通过链表数据结构来存储和操作病人的信息。用户可以通过菜单选择录入病人信息、查找病人信息、修改病人信息、删除病人信息、查看所有病人信息和查看专家信息等操作,还可以根据病人的科室、姓名、性别和联系方式进行查找,以及支持修改病人的科室、姓名、性别和联系方式、浏览所有病人的信息、选择挂号专家进行就诊等。

2024-03-15 11:56:55 869

原创 【Python】使用高斯一勒让德求积(Gauss-Legendre)积分公式进行数值积分

使用Gauss-Legendre积分公式进行数值积分

2024-03-15 11:48:18 598

原创 【Matlab】欧拉公式、梯形公式和改进欧拉公式求解常微分方程

由上图可以看出,随着自变量x的增加,欧拉法、梯形法和改进欧拉法的误差逐渐增加。如上图所示,子图1为x(t)、y(t)、z(t)随时间t的变化,即状态变量随时间的演化,这些变量呈剧烈波动趋势,没有明显的周期性,这也正是混沌系统的典型特征。子图3是x-y-z 三维空间中的相图,展示了状态变量 x、y、z 之间的关系,以及它们在相空间中的轨迹,根据混沌系统的特性,可以观察到双螺旋结构等复杂的轨迹。子图2是x-y平面上的相图,展示了状态变量x和y之间的关系,以及它们在相空间中的轨迹。

2024-03-15 11:13:25 961

原创 【Python】低阶求积与复化求积实现

比较梯形公式与复化梯形公式算出的近似值,可以发现,梯形公式得到的近似值为0.1,而复化梯形公式得到的近似值为0.111402354529548。从这个结果可以看出,复化Simpson公式的精度要高于复化梯形公式,即在相同等分区间的情况下,复化Simpson公式得到的近似值更接近准确值。因此,通过上述比较可以清楚地观察到,在复化求积后,无论是梯形公式还是Simpson公式,都得到了更接近准确值的近似值,从而表明复化求积方法在提高积分近似精度方面的有效性。

2024-03-15 11:04:59 95

原创 【Python】拉格朗日Lagrange插值与牛顿Newton插值求解

给定一组数据节点(x,y),其中x是自变量,y是因变量,其插值的目标是构造一个多项式函数,通过这个多项式函数来拟合已知的数据节点,并用于对其他未知点进行插值预测。由实验结果可以看出,在区间[-5, 5]上,随着插值多项式的阶数增加,插值结果在区间两端出现了明显的振荡现象,这就是Runge现象。为了观察多项式插值问题的Runge现象,使用函数f(x) = 1 / (1 + x^2) 在区间[-5, 5] 上进行Lagrange插值,并比较5次和10次插值多项式的结果。就是通过已知数据节点进行插值预测的函数。

2024-03-15 10:58:20 291

原创 【PyQT】大地线长度计算工具实现

本设计实现了一个大地线长度计算工具,用户可以输入两个点的经纬度坐标,然后点击计算按钮,程序会根据输入的经纬度坐标计算出这两个点之间的大地线长度,并将结果显示在界面上。

2024-03-15 10:42:17 455

原创 使用YOLOv7进行视频实时姿态估计

本文基于YOLOv7进行人体姿态的实时估计,并附录完整代码。

2024-03-07 11:15:56 542

原创 一文搞懂:AI、机器学习与深度学习的联系与区别

在当今科技日新月异的浪潮中,人工智能(Artificial Intelligence, AI)、机器学习(Machine Learning, ML)与深度学习(Deep Learning, DL)如同璀璨星辰,引领着信息技术的新浪潮。这三个词汇频繁出现在各种前沿讨论和实际应用中,但对于许多初涉此领域的探索者来说,它们的具体含义及相互之间的内在联系可能仍笼罩着一层神秘面纱。那让我们先来看看这张图。由此可见,深度学习、机器学习、人工智能三者之间有着层层递进的紧密联系,是的一个分支,而是的一个分支。

2024-03-06 15:23:34 848

原创 【Python】疫苗接种信息管理系统

疫苗接种信息管理系统

2024-03-05 11:55:16 191

原创 Yolov5原理详细解析!一文看懂

Yolov5原理详细解析

2023-10-27 16:08:54 22139 3

原创 基于Pytorch的驾驶员分心行为实时检测

本文使用深度学习和Pytorch实时检测驾驶员的分心行为,并附录完整代码。

2023-10-25 10:38:20 1240

原创 微调Yolov8动物姿势估计模型

本文主要以狗的姿势估计为例,展示如何对当下流行的YOLOv8姿势模型进行Fine-tuning,并附录完整代码。

2023-10-13 18:41:38 706 1

原创 利用KerasCV YOLOv8轻松实现目标精确检测

利用KerasCV YOLOv8轻松实现目标精确检测

2023-10-09 18:29:24 381 2

原创 使用Pytorch从零实现Vision Transformer

使用Pytorch从零实现Vision Transformer

2023-09-27 17:51:57 456

原创 C/C++/Python图像处理算法实战【3】彩色图像灰度化和二值化处理

彩色图像灰度化和二值化处理

2023-09-21 18:24:56 1468

原创 用于小物体检测的切片辅助超推理SAHI实现YOLOv8推理

如下图所示,在推理过程中采用了切片法,最初,原始图像被划分为尺寸为M×N的重叠块。通过结合使用调整大小的补丁和原始图像,模型可以学习到适应不同尺度的物体,并提高对大型物体的检测能力。然而,由于网络的局限性,学习到的特征可能无法充分捕捉到较小物体的微妙而复杂的细节。预训练模型,尤其是使用深度卷积神经网络(CNN)架构的模型,可以捕获丰富的分层特征,这对于小物体的检测非常有帮助。SAHI的独特之处在于它能够与任何物体检测器无缝集成,无需繁琐的微调,并在不影响性能的情况下快速应用,为小物体检测带来了重大的突破。

2023-09-21 16:59:11 4682 1

原创 win10环境下搭建QT+opencv

win10环境下搭建C++ opencv。

2023-09-08 14:22:38 677

原创 C/C++/Python图像处理算法实战【2】读取图片并获取指定像素位置的RGB值

本篇文章旨在通过详细的逐行注释,介绍如何分别使用 C/C++/Python读取图片并获取指定像素位置的RGB值,其中C语言通过算法源码实现,C++和Python通过Opencv实现。

2023-09-07 17:40:02 1805

原创 超详解| Yolov8模型手把手调参 | 配置 | 模型训练 | 验证 | 推理

Yolov8参数详细解析

2023-09-06 18:03:42 66542 21

原创 C/C++/Python图像处理算法实战【1】超详细整理 | 新手入门实用指南 | 图像处理基础

图像处理基础知识

2023-09-05 17:00:08 2326

原创 手把手实现 | 使用Yolov8训练自己的数据集【环境配置-准备数据集(采集&标注&划分)-模型训练(多种方式)-模型预测-模型导出】

使用Yolov8训练自己的数据集

2023-09-04 12:00:18 39064 39

原创 Yolov8原理详细解析!一文看懂

Yolov8原理详细解析

2023-08-30 15:02:38 54791 9

原创 Yolov1原理详细解读及实战(二)实战篇

在中,我们对Yolov1网络结构、算法流程、训练及推理原理进行了详细剖析,本章进入实战环节,话不多说,马上开始!

2023-08-28 16:09:22 223

原创 Yolov1原理详细解读及实战(一)理论篇

Yolo(You Only Look Once)是一种one-stage目标检测算法,即仅需要“看”一次就可以识别出图片中物体的class类别和位置。作为one-stage的开山鼻祖,YOLOv1以其简洁的网络结构和GPU上的实时检测速度而一鸣惊人,打破了R-CNN的“垄断”地位,为目标检测领域带来巨大的变革。Yolov1将目标检测任务重新定义为单个回归问题,仅使用一个卷积神经网络直接预测图像的Bounding box及其class类别的概率。

2023-08-28 15:59:41 692

原创 Pytorch基础及实战(5)——模型组网

模型组网

2023-08-22 17:49:44 305

原创 Pytorch基础及实战(4)——transforms数据增强

Transformers数据增强

2023-07-03 15:12:14 672

原创 Pytorch基础及实战(3)——深入浅出PyTorch数据读取机制

深入浅出Pytorch数据读取机制——Dataset和Dataloader

2023-05-17 15:51:13 439

原创 Pytorch基础及实战(1)—— 一文详解Pytorch中的Tensor操作

一文详解Pytorch中的Tensor操作

2023-05-17 15:43:16 3746

原创 Pytorch基础及实战(2)——小白眼中的卷积神经网络(CNN)

小白眼中的卷积神经网络(CNN)

2023-05-17 15:32:46 509

原创 Mindspore安装

本文用于记录搭建昇思MindSpore开发及使用环境的过程,并通过MindSpore的API快速实现了一个简单的深度学习模型。

2023-02-18 18:30:00 3952 1

原创 git详细使用

git常见命令使用

2022-05-31 13:34:55 2035

Waste-Sorter-master.zip

用**fastai**库(建在**PyTorch**上)将图像分类为纸板,玻璃,金属,纸张,塑料或垃圾。使用了由Gary Thung和Mindy Yang手动收集的图像数据集

2020-05-25

trashnet-master.zip

训练一个卷积神经网络,用**fastai**库(建在**PyTorch**上)将图像分类为纸板,玻璃,金属,纸张,塑料或垃圾。这是由Gary Thung和Mindy Yang手动收集的图像数据集

2020-05-25

inttypes与stdint.h.rar

我们有时候需要使用int有关的宏,比如PRId64,int64_t等,就需要包含这两个头文件。其中inttypes.h是标准C函数库的头文件,提供整数输入的各种转换宏。在系统中,其所在路径为:/usr/include/inttypes.h。stdint.h是c99中引进的一个标准C库的头文件.

2020-01-19

(机器学习-使用OpenCV和Python进行智能图像处理)Machine Learning for OpenCV.pdf

本书是一本基于OpenCV和Python的机器学习实战手册,既详细介绍机器学习及OpenCV相关的基础知识,又通过具体实例展示如何使用OpenCV和Python实现各种机器学习算法,并提供大量示列代码,可以帮助你掌握机器学习实用技巧,解决各种不同的机器学习和图像处理问题。

2019-07-25

基于ROS的机械臂运动控制

基于ROS的机械臂运动控制源代码,包含六自由度机械臂的Rviz仿真模型、moveit运动轨迹规划、机械臂运动控制以及相机标定等源代码及脚本程序。

2018-08-01

protoc-3.3.0-win32

protobuf 在windows下的代码生成工具,可以生成各种语言版本的代码 (Protocol Buffers (a.k.a., protobuf) are Google's language-neutral, platform-neutral, extensible mechanism for serializing structured data. You can find protobuf's documentation on the Google Developers site.)

2017-12-27

visio在线安装包

用于window10系统下的visio安装,Microsoft Visio在Windows操作系统下运行的流程图和矢量绘图;方便 IT和商务专业人员进行复杂信息、系统和流程进行、可视化处理、分析交流等日常安排,是绘制流程图使用率最高的软件之一,新版的visio2016提供了直观 共享的的模板功能,非常便捷,方便。

2017-12-27

protobuf-3.5.1.zip

Protoc用于编译相关程序运行文件,解压后将bin文件夹内的protoc.exe拷贝到c:\windows\system32目录下(用于将protoc.exe所在的目录配置到环境变量当中)。

2017-12-27

LED摇摇棒.SchDoc

要明白这个电路的原理的话, 需要硬件编程语言的基本知识,比如 VHDL,CPLD之类的啊。 当然不会也没有关系,单单只是借电路的话很简单.

2015-12-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除