- 博客(154)
- 资源 (9)
- 收藏
- 关注
原创 使用自己的数据集训练DETR模型
本文将使用四个预训练的DETR模型(DETR ResNet50、DETR ResNet50 DC5、DETR ResNet101和DETR ResNet101 DC5)在自定义数据集上对其进行微调,通过比较它们在自定义数据集上的mAP,来比较评估每个模型的检测精度。
2024-05-17 15:27:03 285
原创 基于Multiscale Vision Transformer的视频动作识别
本文基于Multiscale Vision Transformer进行视频动作识别,并附录完整代码。
2024-04-18 17:20:01 477 1
原创 三万字长文超详细解读LLama2!
自从Transformer架构问世以来,大型语言模型(Large Language Models, LLMs)以及AIGC技术的发展速度惊人,它们不仅在技术层面取得了重大突破,还在商业应用、社会影响等多个层面展现出巨大潜力。随着ChatGPT的推出,这一技术日益走进大众视野,这也预示着一个由生成式AI塑造的未来正在加速到来。与此同时,Meta AI Meta AI在2023年推出了LLama(Large Language Model Meta AI)系列大语言模型,这一模型初期是以较为封闭的形式面向特定
2024-04-18 11:51:40 2688
原创 一文搞懂Tokenization
语言模型是对文本进行推理,文本通常是字符串形式,但是模型的输入只能是数字,因此需要将文本转换成数字形式。Tokenization是NLP的基本任务,按照特定需求能把一段连续的文本序列(如句子、段落等)切分为一个字符串序列(如单词、短语、字符、标点等多个单元),其中的元素称为token或词语。具体流程如下图所示,首先将文本句子切分成一个个单元,然后将子单元数值化(映射为向量),再将这些向量输入到模型进行编码,最后输出到下游任务进一步得到最终的结果。
2024-04-11 17:32:29 871
原创 使用Pytorch从零实现Transformer模型
2017年Google在论文《Attention is All You Need》中提出了Transformer模型,并成功应用到NLP领域。该模型完全基于自注意力机制Attention mechanism实现,弥补了传统的RNN模型的不足。本文笔者将详解使用Pytorch从零开始逐步实现Transformer模型。
2024-04-10 10:31:54 2453 2
原创 大概是最全的开源大模型LLM盘点了吧!
LLM(Large Language Model, 大型语言模型)是指那些规模庞大、参数数量众多的深度神经网络模型,用于理解和生成自然语言文本。在自然语言处理(NLP)领域有着广泛的应用,因其强大的语言理解和生成能力,能够处理各种复杂的文本任务,包括但不限于翻译、问答、文本摘要、对话、文本分类、情感分析、代码生成、创作辅助等。LLM主要基于Transformer架构,该架构由Vaswani等人在2017年的论文《Attention is All You Need》中提出。
2024-04-10 10:24:05 1870
原创 超详细解读Transformer框架
首先我们先对Transformer来个直观的认识。Transformer出现以前,NLP领域应用基本都是以RNN或LSTM循环处理完成,一个token一个tokrn输入到模型中。模型本身是一种顺序结构,包含token在序列中的位置信息。会出现梯度消失现象,无法支持长时间序列。句子越靠后的token对结果的影响越大。只能利用上文信息,无法获取下文信息。循环网络逐个token输入,也就是句子有多长就要循环多少遍,计算的效率低。而Transformer的出现得以解决了上述的一系列问题。
2024-04-09 12:13:14 2029
原创 一文搞懂NLP框架之RNN、LSTM、Transformer结构原理!
NLP领域中,特征提取可谓是经历了显著的“变迁”与发展。回首过往,RNN曾以其一度引领潮流,如今正如同明日黄花,逐步淡出历史舞台。紧接着,LSTM以展现出强大的生命力,虽已非最前沿,却仍老骥伏枥,若能进一步优化,其潜力不可小觑。而今,Transformer架构如日中天,凭借自注意力机制彻底革新了特征提取的方法,已在NLP诸多任务中发挥着中流砥柱的作用。本文笔者将深入浅出剖析RNN、LSTM以及Transformer的核心结构原理,一起见证算法是怎样做到一浪更比一浪强的。
2024-04-09 11:56:53 3064
原创 【C语言】病人信息管理系统
本设计实现了一个病人信息管理系统,通过链表数据结构来存储和操作病人的信息。用户可以通过菜单选择录入病人信息、查找病人信息、修改病人信息、删除病人信息、查看所有病人信息和查看专家信息等操作,还可以根据病人的科室、姓名、性别和联系方式进行查找,以及支持修改病人的科室、姓名、性别和联系方式、浏览所有病人的信息、选择挂号专家进行就诊等。
2024-03-15 11:56:55 869
原创 【Matlab】欧拉公式、梯形公式和改进欧拉公式求解常微分方程
由上图可以看出,随着自变量x的增加,欧拉法、梯形法和改进欧拉法的误差逐渐增加。如上图所示,子图1为x(t)、y(t)、z(t)随时间t的变化,即状态变量随时间的演化,这些变量呈剧烈波动趋势,没有明显的周期性,这也正是混沌系统的典型特征。子图3是x-y-z 三维空间中的相图,展示了状态变量 x、y、z 之间的关系,以及它们在相空间中的轨迹,根据混沌系统的特性,可以观察到双螺旋结构等复杂的轨迹。子图2是x-y平面上的相图,展示了状态变量x和y之间的关系,以及它们在相空间中的轨迹。
2024-03-15 11:13:25 961
原创 【Python】低阶求积与复化求积实现
比较梯形公式与复化梯形公式算出的近似值,可以发现,梯形公式得到的近似值为0.1,而复化梯形公式得到的近似值为0.111402354529548。从这个结果可以看出,复化Simpson公式的精度要高于复化梯形公式,即在相同等分区间的情况下,复化Simpson公式得到的近似值更接近准确值。因此,通过上述比较可以清楚地观察到,在复化求积后,无论是梯形公式还是Simpson公式,都得到了更接近准确值的近似值,从而表明复化求积方法在提高积分近似精度方面的有效性。
2024-03-15 11:04:59 95
原创 【Python】拉格朗日Lagrange插值与牛顿Newton插值求解
给定一组数据节点(x,y),其中x是自变量,y是因变量,其插值的目标是构造一个多项式函数,通过这个多项式函数来拟合已知的数据节点,并用于对其他未知点进行插值预测。由实验结果可以看出,在区间[-5, 5]上,随着插值多项式的阶数增加,插值结果在区间两端出现了明显的振荡现象,这就是Runge现象。为了观察多项式插值问题的Runge现象,使用函数f(x) = 1 / (1 + x^2) 在区间[-5, 5] 上进行Lagrange插值,并比较5次和10次插值多项式的结果。就是通过已知数据节点进行插值预测的函数。
2024-03-15 10:58:20 291
原创 【PyQT】大地线长度计算工具实现
本设计实现了一个大地线长度计算工具,用户可以输入两个点的经纬度坐标,然后点击计算按钮,程序会根据输入的经纬度坐标计算出这两个点之间的大地线长度,并将结果显示在界面上。
2024-03-15 10:42:17 455
原创 一文搞懂:AI、机器学习与深度学习的联系与区别
在当今科技日新月异的浪潮中,人工智能(Artificial Intelligence, AI)、机器学习(Machine Learning, ML)与深度学习(Deep Learning, DL)如同璀璨星辰,引领着信息技术的新浪潮。这三个词汇频繁出现在各种前沿讨论和实际应用中,但对于许多初涉此领域的探索者来说,它们的具体含义及相互之间的内在联系可能仍笼罩着一层神秘面纱。那让我们先来看看这张图。由此可见,深度学习、机器学习、人工智能三者之间有着层层递进的紧密联系,是的一个分支,而是的一个分支。
2024-03-06 15:23:34 848
原创 微调Yolov8动物姿势估计模型
本文主要以狗的姿势估计为例,展示如何对当下流行的YOLOv8姿势模型进行Fine-tuning,并附录完整代码。
2023-10-13 18:41:38 706 1
原创 用于小物体检测的切片辅助超推理SAHI实现YOLOv8推理
如下图所示,在推理过程中采用了切片法,最初,原始图像被划分为尺寸为M×N的重叠块。通过结合使用调整大小的补丁和原始图像,模型可以学习到适应不同尺度的物体,并提高对大型物体的检测能力。然而,由于网络的局限性,学习到的特征可能无法充分捕捉到较小物体的微妙而复杂的细节。预训练模型,尤其是使用深度卷积神经网络(CNN)架构的模型,可以捕获丰富的分层特征,这对于小物体的检测非常有帮助。SAHI的独特之处在于它能够与任何物体检测器无缝集成,无需繁琐的微调,并在不影响性能的情况下快速应用,为小物体检测带来了重大的突破。
2023-09-21 16:59:11 4682 1
原创 C/C++/Python图像处理算法实战【2】读取图片并获取指定像素位置的RGB值
本篇文章旨在通过详细的逐行注释,介绍如何分别使用 C/C++/Python读取图片并获取指定像素位置的RGB值,其中C语言通过算法源码实现,C++和Python通过Opencv实现。
2023-09-07 17:40:02 1805
原创 手把手实现 | 使用Yolov8训练自己的数据集【环境配置-准备数据集(采集&标注&划分)-模型训练(多种方式)-模型预测-模型导出】
使用Yolov8训练自己的数据集
2023-09-04 12:00:18 39064 39
原创 Yolov1原理详细解读及实战(二)实战篇
在中,我们对Yolov1网络结构、算法流程、训练及推理原理进行了详细剖析,本章进入实战环节,话不多说,马上开始!
2023-08-28 16:09:22 223
原创 Yolov1原理详细解读及实战(一)理论篇
Yolo(You Only Look Once)是一种one-stage目标检测算法,即仅需要“看”一次就可以识别出图片中物体的class类别和位置。作为one-stage的开山鼻祖,YOLOv1以其简洁的网络结构和GPU上的实时检测速度而一鸣惊人,打破了R-CNN的“垄断”地位,为目标检测领域带来巨大的变革。Yolov1将目标检测任务重新定义为单个回归问题,仅使用一个卷积神经网络直接预测图像的Bounding box及其class类别的概率。
2023-08-28 15:59:41 692
原创 Mindspore安装
本文用于记录搭建昇思MindSpore开发及使用环境的过程,并通过MindSpore的API快速实现了一个简单的深度学习模型。
2023-02-18 18:30:00 3952 1
Waste-Sorter-master.zip
2020-05-25
trashnet-master.zip
2020-05-25
inttypes与stdint.h.rar
2020-01-19
(机器学习-使用OpenCV和Python进行智能图像处理)Machine Learning for OpenCV.pdf
2019-07-25
protoc-3.3.0-win32
2017-12-27
visio在线安装包
2017-12-27
protobuf-3.5.1.zip
2017-12-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人