自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI_ayuan的博客

专注于各类AI算法竞赛,数学建模,人工智能知识干货的分享

  • 博客(21)
  • 收藏
  • 关注

原创 循环神经网络(RNN)的原理及实现

在前馈神经网络中,信息的传递是单向的,这种限制虽然使得网络变得更容易学习,但在一定程度上也减弱了神经网络模型的能力。在生物神经网络中,神经元之间的连接关系要复杂的多。前馈神经网络可以看着是一个复杂的函数,每次输入都是独立的,即网络的输出只依赖于当前的输入。但是在很多现实任务中,网络的输入不仅和当前时刻的输入相关,也和其过去一段时间的输出相关。比如一个有限状态自动机,其下一个时刻的状态(输出)不仅仅和当前输入相关,也和当前状态(上一个时刻的输出)相关。此外,前馈网络难以处理时序数据,比如视频、语音、文本等。

2023-03-20 23:47:14 2262

原创 集成学习的基本步骤

集成学习一般可分为以下3个步骤。(1)找到误差互相独立的基分类器。(2)训练基分类器。(3)合并基分类器的结果。

2023-03-17 20:45:59 589

原创 集成学习中的Boosting和Bagging

集成学习是一大类模型融合策略和方法的统称,其中包含多种集成学习的思想。

2023-03-16 23:50:41 434

原创 机器学习中的特征工程

特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。从本质上来讲,特征工程是一个表示和展现数据的过程。在实际工作中,特征工程旨在去除原始数据中的杂质和冗余,设计更高效的特征以刻画求解的问题与预测模型之间的关系。

2023-03-15 21:25:02 472

原创 Pytorch从零开始实现线性回归

下面是线性回归的矢量计算表达式的实现。我们使用mm函数做矩阵乘法。def linreg(X, w, b): # 本函数已保存在d2lzh_pytorch包中⽅方便便以后使⽤用我们使用上一节描述的平方损失来定义线性回归的损失函数。在实现中,我们需要把真实值y变形成预测值y_hat的形状。以下函数返回的结果也将和y_hat的形状相同。以下的sgd函数实现了上一节中介绍的小批量随机梯度下降算法。它通过不断迭代模型参数来优化损失函数。这里自动求梯度模块计算得来的梯度是一个批量样本的梯度和。

2023-03-14 20:54:33 345

原创 经典卷积神经网络(二):VGG-Nets、Network-In-Network和深度残差网络

上一节我们介绍了**LeNet-5**和**AlexNet**网络,本节我们将介绍**VGG-Nets**、**Network-In-Network**和**深度残差网络(residual network)**。

2023-03-14 16:02:03 563

原创 线性回归和神经网络的联系

为了更清晰地展示线性回归作为神经网络的结构,下图使用神经网络图表示本节中介绍的线性回归模型。在介绍线性回归的矢量计算表达式之前,让我们先考虑对两个向量相加的两种方法。,因此输入层的输入个数为2。这节我们解释线性回归与神经网络的联系,以及线性回归的矢量计算表达式。,输出层的输出个数为1。需要注意的是,我们直接将图中神经网络的输出。由于输入层并不涉及计算,按照惯例,如图所示的神经网络的层数为1。向量相加的另一种方法是,将这两个向量直接做矢量加法。向量相加的另一种方法是,将这两个向量直接做矢量加法。

2023-03-13 16:46:21 486

原创 经典卷积神经网络(一):LeNet-5和AlexNet

本节介绍几种广泛使用的典型深层卷积神经网络。

2023-03-11 22:16:51 800

原创 机器学习中的线性回归基本要素

线性回归输出是一个连续值,因此适用于回归问题。回归问题在实际中很常见,如预测房屋价格、⽓温、销售额等连续值的问题。与回归问题不同,分类问题中模型的最终输出是一个**离散值**。我们所说的图像分类、垃圾邮件识别、疾病检测等输出为离散值的问题都属于分类问题的范畴。softmax回归则适用于分类问题。

2023-03-11 17:53:00 345

原创 卷积神经网络中的参数学习

在卷积神经网络中,主要有两种不同功能的神经层:卷积层和汇聚层。如图中,所有的同颜色连接上的权重是相同的。参数为卷积核以及偏置,因此只需要计算卷积层中参数的梯度。卷积网络中,每层参数的梯度依赖其所在层的误差项。参数个数和神经元的数量无关。

2023-03-10 20:39:34 1578

原创 卷积神经网络经典结构

卷积神经网络具有几种基本部件:卷积、汇合、激活函数、全连接层和目标函数。如何“有机组合”才能让模型工作、发挥效能呢?

2023-03-10 14:50:35 293 2

原创 CVPR2023最新论文 (含语义分割、扩散模型、多模态、预训练、MAE等方向)

2023 年 2 月 28 日凌晨,CVPR 2023 顶会论文接收结果出炉!CVPR 2023 收录的工作中 " 扩散模型、多模态、预训练、MAE " 相关工作的数量会显著增长。

2023-03-06 14:47:11 15076

原创 机器学习的优化算法

在确定了训练集D、假设空间F以及学习准则后,如何找到最优的模型fx;θ就成了一个最优化(Optimization)问题.机器学习的训练过程其实就是最优化问题的求解过程.在机器学习中,优化又可以分为参数优化和超参数优化.模型fx;θ中的θ称为模型的参数,可以通过优化算法进行学习.除了可学习的参数θ之外,还有一类参数是用来定义模型结构或优化策略的,这类参数叫作超参数(Hyper-Parameter)

2023-03-04 22:09:16 427

原创 基于OpenCV构建停车场车位识别项目

OpenCV是一个基于(开源)发行的跨平台计算机视觉库,能实现图像处理和计算机视觉方面的很多通用算法。车位识别的图像处理过程如图所示。在python中设置完所有内容后, 最重要的依赖关系将是OpenCV库。通过pip将其添加到虚拟环境中,可以运行。要检查所有设置是否正确,我们可以使用以下命令打印环境中可用的当前OpenCV版本。

2023-03-03 15:52:09 3440 29

原创 机器学习的三个基本因素【模型、学习准则、优化算法】

机器学习是从有限的观测数据中学习(或“猜测”)出具有一般性的规律,并可以将总结出来的规律推广应用到未观测样本上。机器学习方法可以粗略地分为三个基本要素:模型、学习准则、优化算法。

2023-03-01 17:40:42 1128 2

原创 PyTorch自动求梯度

如何使用PyTorch进行自动梯度计算

2023-02-24 15:29:19 464 1

原创 将Tensor和NumPy相互转换的方法

tensor和numpy相互转化的方法

2023-02-17 21:11:49 5224 2

原创 ChatGPT火爆科研圈,登上《Nature》《Science》正刊

ChatGPT火出圈了,几乎涉及到各行各业的每个领域,科研圈更甚。

2023-02-17 15:28:08 3689

原创 超声三维重建算法研究

在三维超声弹性成像中,三维重建是将二维弹性图转化成三维超声弹性图的关键一步。三维重建算法按照其原理的不同可以分为三类:基于像素的三维重建算法(PBM)、基于体素的三维重建算法(VBM)、基于函数的三维重建算法(FBM)。

2023-02-17 14:45:08 1827 4

原创 Pytorch基本数据操作(Tensor的运算)【深度学习从0到1】

在PyTorch中,我们主要通过torch.Tensor对数据进行存储和变换操作,使用过numpy库的我们就可以发现,tensor和numpy里的多维数组十分相似。但是由于tensor提供GPU计算和自动求梯度等功能从而更适合深度学习。

2023-02-13 20:43:16 623 5

原创 简历加“金”,保研考研和就业学生党的必备方法【文末附带学习福利】

如何为自己的简历加“金”,阿远学长给从事计算机AI相关方向的小伙伴们提供了一系列相关的高质量赛事和相关资料。

2023-02-10 17:26:47 210 6

机器学习项目代码加数据集

通过这些项目使你能够快速学习和增强机器学习技能。这些机器学习项目可以用Python,R或任何其他工具来开发。 机器学习项目模板:ML项目的6个基本步骤 每个机器学习 项目都有自己独特的形式。对于每个项目,都可以遵循一组预定义的步骤。尽管没有严格的流程,但是可以提出一个通用模板。

2023-03-03

Nolinear 3DMM,从2D图像到3D人脸重建

基于图像的人脸三维重建在人脸分析与娱乐领域里有巨大的应用场景,同时它也可以用于提升人脸关键点检测,人脸识别,人脸编辑等很多任务。其中基于3DMM模型的核心技术及其研究进展相关代码。

2023-03-03

YOLO v5 全套代码实现

YOLOv5 的表现要优于谷歌开源的目标检测框架 EfficientDet,尽管 YOLOv5 的开发者没有明确地将其与 YOLOv4 进行比较,但他们却声称 YOLOv5 能在 Tesla P100 上实现 140 FPS 的快速检测。 YOLOV5都会通过数据加载器传递每一批训练数据,并同时增强训练数据。数据加载器进行三种数据增强:缩放,色彩空间调整和马赛克增强。 有意思的是,有媒体报道,YOLO V5的作者Glen Jocher正是Mosaic Augmentation的创造者,他认为YOLO V4性能巨大提升很大程度是马赛克数据增强的功劳,也许是不服,他在YOLO V4出来后的仅仅两个月便推出YOLO V5,当然未来是否继续使用YOLO V5的名字或者采用其他名字,首先得看YOLO V5的最终研究成果是否能够真正意义上领先YOLO V4。 但是不可否认的是马赛克数据增强确实能有效解决模型训练中最头疼的“小对象问题”,即小对象不如大对象那样准确地被检测到。

2023-03-03

YOLO实现吸烟行为检测(全套代码实现,包含说明)

目前,基于深度学习的目标检测方法主要有两大分支,分别是基于区域提取的两阶段目标检测模型和直接进行位置回归的一阶段目标检测模型。 故本项目通过采用深度学习方法实现对吸烟行为的目标检测,使用python语言搭建YOLO算法实现对吸烟行为的实时监测。 YOLO算法将整幅图像分为了多个网格单元,对每个网格中心目标进行检测,该算法不用生成候选区域,在一个卷积网络中就可以完成特征提取、分类回归等任务,检测过程得到了简化,检测速度也变得更快,但该算法对于小尺度目标的检测不够准确,如果图像中存在重叠遮挡等现象就可能出现遗漏。

2023-03-03

opencv最全相关代码+资料

OpenCV从入门到精通最全代码+资料。OpenCV是一个开源的计算机视觉库,是英特尔公司资助的两大图像处理利器之一。 它为图像处理、模式识别、三维重建、物体跟踪、机器学习和线性代数提供了各种各样的算法。人脸识别、自动驾驶、物体检测……想进军未来高科技行业,OpenCV是基石。系统掌握计算机视觉核心知识体系,突破OpenCV重难点,真实落地“车辆检测、文字识别、图像拼接” 三大典型项目,高效积累计算机视觉实战经验与能力。

2023-02-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除