推动人工智能发展的24个经典模型,揭秘卷积神经网络的革命

最新推荐文章于 2024-08-22 07:51:42 发布

计算机视觉工坊

最新推荐文章于 2024-08-22 07:51:42 发布

阅读量593

点赞数 24

文章标签：人工智能 cnn 神经网络深度学习机器学习

本文链接：https://blog.csdn.net/weixin_46788581/article/details/140623340

版权

点击下方卡片，关注「计算机视觉工坊」公众号
选择星标，干货第一时间送达

编辑：计算机视觉工坊，作者：小张Tt

添加小助理：dddvision，备注：方向+学校/公司+昵称，拉你入群。文末附行业细分群

扫描下方二维码，加入3D视觉知识星球，星球内凝聚了众多3D视觉实战问题，以及各个模块的学习资料：近20门视频课程（星球成员免费学习）、最新顶会论文、3DGS系列、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研，欢迎扫码加入！

在人工智能的浪潮中，深度学习模型无疑是最为闪耀的明星。它们不仅推动了技术的飞速发展，也为各行各业的创新应用提供了无限可能。

LeNet5：

作为卷积神经网络的鼻祖，LeNet5在手写数字识别领域取得了突破性成果，为后续深度学习模型的发展奠定了基础。

AlexNet：

2012年，AlexNet在ImageNet竞赛中一鸣惊人，大幅提高了图像识别的准确率，开启了深度学习在图像处理领域的新篇章。

VGG：

VGG网络通过堆叠多个卷积层，实现了深度网络的构建，为深度学习模型的设计提供了新的思路。

Inception Network：Inception

网络引入了模块化的设计理念，通过不同尺寸的卷积核提取特征，提高了网络的性能。

R-CNN：

R-CNN将卷积神经网络应用于物体检测任务，为后续目标检测技术的发展奠定了基础。

ResNet (Residual Networks)：

ResNet通过引入残差单元，成功解决了深度网络训练中的梯度消失问题，使得训练更深的网络成为可能。

U-Net：

U-Net在医学图像分割领域取得了显著成果，为医疗领域的AI应用提供了有力支持。

YOLO (You Only Look Once)：

YOLO实现了实时物体检测，大大提高了目标检测的效率。

GAN (Generative Adversarial Networks)：

GAN通过对抗学习生成新的数据样本，为数据增强和创意应用提供了广阔空间。

Transformer：

Transformer的自注意力机制为自然语言处理任务带来了革命性变革，成为后续许多模型的基石。

BERT (Bidirectional Encoder Representations from Transformers)：

BERT在多项自然语言处理任务中取得了优异表现，推动了预训练语言模型的发展。

GPT (Generative Pre-trained Transformer)：

GPT系列模型在文本生成、理解和交互等领域展现了强大的能力。

Capsule Network：

Capsule Network致力于更好地理解图像中的空间关系，为计算机视觉领域带来了新的研究方向。

ELMO (Embeddings from Language Models)：

ELMO为单词赋予了丰富的上下文信息，提高了自然语言处理任务的性能。

Vision Transformer：

Vision Transformer将Transformer应用于图像识别任务，取得了与传统卷积神经网络相媲美的效果。

EfficientNet：

EfficientNet通过神经架构搜索，实现了高效、准确的卷积神经网络设计。

MobileNets：

MobileNets针对移动和边缘设备进行了优化，使得深度学习在移动端得以广泛应用。

SqueezeNet：

SqueezeNet通过_fire模块_大幅减少了参数数量，为轻量级网络设计提供了新思路。

DenseNet：

DenseNet通过连接每层与前层，提高了网络的参数效率，进一步推动了深度学习的发展。

AlphaGo：

AlphaGo在围棋领域的突破性成果，展示了深度学习在复杂决策任务中的强大潜力。

Diffusion Model：

Diffusion Model通过模拟数据分布的扩散过程，为生成模型带来了新的研究方向。

Seq2Seq：

用于机器翻译、文本摘要等任务，引入了编码器-解码器架构。

DQN(Deep Q-Network)：

结合了深度学习和Q学习，在强化学习领域取得了重要进展。

MAML (Model-Agnostic Meta-Learning)：

一种通用的元学习方法，能够在多种任务上快速适应。

本文仅做学术分享，如有侵权，请联系删文。

计算机视觉工坊交流群

目前我们已经建立了3D视觉方向多个社群，包括2D计算机视觉、大模型、工业3D视觉、SLAM、自动驾驶、三维重建、无人机等方向，细分群包括：

2D计算机视觉：图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等

大模型：NLP、CV、ASR、生成对抗大模型、强化学习大模型、对话大模型等

工业3D视觉：相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。

SLAM：视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。

自动驾驶：深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、自动驾驶综合群等、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、BEV感知、Occupancy、目标跟踪、端到端自动驾驶等。

三维重建：3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等

无人机：四旋翼建模、无人机飞控等

除了这些，还有求职、硬件选型、视觉产品落地、最新论文、3D视觉最新产品、3D视觉行业新闻等交流群

添加小助理: dddvision，备注：研究方向+学校/公司+昵称（如3D点云+清华+小草莓）, 拉你入群。

▲长按扫码添加助理

3D视觉学习知识星球

3D视觉从入门到精通知识星球、国内成立最早、6000+成员交流学习。包括：星球视频课程近20门（价值超6000）、项目对接、3D视觉学习路线总结、最新顶会论文&代码、3D视觉行业最新模组、3D视觉优质源码汇总、书籍推荐、编程基础&学习工具、实战项目&作业、求职招聘&面经&面试题等等。欢迎加入3D视觉从入门到精通知识星球，一起学习进步。

▲长按扫码加入星球

3D视觉课程官网：www.3dcver.com

3DGS、NeRF、结构光、相位偏折术、机械臂抓取、点云实战、Open3D、缺陷检测、BEV感知、Occupancy、Transformer、模型部署、3D目标检测、深度估计、多传感器标定、规划与控制、无人机仿真、三维视觉C++、三维视觉python、dToF、相机标定、ROS2、机器人控制规划、LeGo-LAOM、多模态融合SLAM、LOAM-SLAM、室内室外SLAM、VINS-Fusion、ORB-SLAM3、MVSNet三维重建、colmap、线面结构光、硬件结构光扫描仪，无人机等。

▲长按扫码学习3D视觉精品课程

3D视觉相关硬件

图片	说明	名称
	硬件+源码+视频教程	精迅V1(科研级)）单目/双目3D结构光扫描仪
	硬件+源码+视频教程	深迅V13D线结构光三维扫描仪
	硬件+源码+视频教程	御风250无人机(基于PX4)
	低成本+体积小 +重量轻+抗高反	YA001高精度3D相机
	抗高反+无惧黑色+半透明	KW-D \| 高精度3D结构光开源相机
	硬件+源码	工坊智能ROS小车‍
	配套标定源码	高精度标定板(玻璃or大理石)
添加微信:cv3d007或者QYong2014 咨询更多

欢迎点个 在看， 你最 好看！

计算机视觉工坊

关注

24
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
推动人工智能发展的24个经典模型,揭秘卷积神经网络的革命

点击下方卡片，关注「计算机视觉工坊」公众号选择星标，干货第一时间送达编辑：计算机视觉工坊，作者：小张Tt添加小助理：dddvision，备注：方向+学校/公司+昵称，拉你入群。文末附行业细分群扫描下方二维码，加入3D视觉知识星球，星球内凝聚了众多3D视觉实战问题，以及各个模块的学习资料：近20门视频课程（星球成员免费学习）、最新顶会论文、3DGS系列、计算机视觉书籍、优质3D视觉算法源码等。想要入...
复制链接

扫一扫