自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

视觉领域一只菜鸟,谦卑,修身,修心,修德行,深耕:CV、DL...

  • 博客(269)
  • 收藏
  • 关注

原创 系列文章汇总

目录目标检测算法源码解析:MaskRCNN源码解析:MaskRCNN源码解析1:整体结构概述MaskRCNN源码解析2:特征图与anchors生成MaskRCNN源码解析3:RPN、ProposalLayer、DetectionTargetLayerMaskRCNN源码解析4-0:ROI Pooling 与 ROI Align理论MaskRCNN源码解析4:头网络(Ne...

2020-06-16 20:38:50 5444 4

原创 个人微信公众号及个人GitHub信息

写技术博客,主要是作为自己技术积累的一个笔记,不求与人相比,但求不断超越自己!加油!CSDN个人专栏信息现在不能用了,但是有些信息需要连接一下,方便使用,所以在专门放一篇文章吧。1,点击访问个人GitHub2,点击访问个人知乎3,点击访问个人CSDN博客主页4,点击访问个人微信公众号 欢迎各位扫码关注我的微信公众号: 有好多小伙伴在公众号给我留言...

2019-06-20 11:16:20 5567 2

转载 OCR识别

文字识别是计算机视觉研究领域的分支之一,归属于模式识别和人工智能,是计算机科学的重要组成部分。本文将以上图为主要线索,简要阐述在文字识别领域中的各个组成部分。一 ,文字识别简介计算机文字识别,俗称光学字符识别,英文全称是Optical Character Recognition(简称OCR),它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人...

2018-11-11 10:31:49 3896

原创 人工智能,机器学习, 深度学习框架图

1、深度学习框架图: 2、神经网络要解决的问题2.1、基于网络功能函数的定义(网络模型的选择,激励函数的选择,优化方法的选择)–>网络模型好坏的评估(损失函数的定义)–>选出一

2018-09-14 15:36:14 6596 1

原创 几个目标跟踪算法

目标跟踪算法是一种计算机视觉技术,用于在视频或图像序列中检测并跟踪移动的目标,如人、车辆或物体。这些算法利用图像处理和机器学习技术,通过分析连续帧之间的变化,识别并跟踪目标的位置、轨迹和其他属性。这些算法在监控、自动驾驶、增强现实等领域有广泛应用。常见的目标跟踪算法包括卡尔曼滤波器、粒子滤波器、相关滤波器以及基于深度学习的算法,如卷积神经网络(CNN)和循环神经网络(RNN)。

2024-11-01 09:50:57 759

原创 模型轻量化之模型剪枝-Pruning

学术界的 SOTA 模型在落地部署到工业界应用到过程中,通常是要面临着低延迟(Latency)、高吞吐(Throughpout)、高效率(Efficiency)的挑战。而模型压缩算法可以将一个庞大而复杂的预训练模型转化为一个精简的小模型,从而减少对硬件的存储、带宽和计算需求,以达到加速模型推理和落地的目的。近年来主流的模型压缩方法包括:模型量化、模型剪枝、知识蒸馏、轻量化网络设计、张量分解等。

2024-10-29 09:37:36 652

原创 目标检测算法-YOLOV11解析

YOLOv11是由Ultralytics公司开发的新一代目标检测算法,它在之前YOLO版本的基础上进行了显著的架构和训练方法改进。整合了。

2024-10-24 20:29:04 830

原创 不同框架下跑yolov10(pt、onnx_runtime、tensorrt)

不同框架下跑yolov10(pt、onnx_runtime、tensorrt)

2024-09-02 10:14:39 3835

原创 深度学习模型量化方法

深度学习模型量化是一项重要的技术,旨在通过减少网络参数的比特宽度(‌比特宽度是指在特定时间内,数据传输过程中每个比特所占用的时间或空间)来减小模型大小和加速推理过程,同时保持模型性能,以便将模型部署到边缘或低算力设备上,实现降低成本、提高效率的目标。

2024-09-02 10:13:25 3543

原创 LangChain

在人工智能领域的不断发展中,语言模型扮演着重要的角色。特别是大型语言模型(LLM),如 ChatGPT,已经成为科技领域的热门话题,并受到广泛认可。在这个背景下,LangChain 作为一个以 LLM 模型为核心的开发框架出现,为自然语言处理开启了一个充满可能性的世界。借助 LangChain,我们可以创建各种应用程序,包括聊天机器人和智能问答工具。LangChain之所以大火,是因为它提供了一系列方便的工具、组件和接口,大大降低了 AI 应用开发的门槛,也极大简化了大模型应用程序的开发过程。

2024-09-02 10:01:24 2770

原创 YOLOv10目标检测论文翻译及解释

YOLOv10目标检测论文翻译及解释

2024-08-15 10:18:37 3027

原创 多模态综述(MultiModal Learning)

多模态综述(MultiModal Learning)

2024-04-24 09:52:28 6148

原创 目标检测算法-YOLOV9解析(附论文和源码)

YOLOv9引入了两种新的架构:YOLOv9和GELAN,这两种架构都可以从论文发布的YOLOv9 Python库中使用。YOLOv9有四种模型,按参数个数排序是:v9-S、v9-M、v9-C、v9-E。目前v9 - S和v9 - M的权重暂不可用。其中最小的模型在MS COCO数据集的验证集上达到了46.8 %的AP,而最大的模型达到了55.6 %。

2024-04-15 09:44:46 5271

原创 目标检测算法-transformer系列-YOLOS(附论文和源码)

目标检测算法-transformer系列-YOLOS(附论文和源码)

2023-10-24 10:37:35 4517

原创 目标检测算法-transformer系列-ViT(Vision Transformer)(附论文和源码)

目标检测算法-transformer系列-ViT(Vision Transformer)(附论文和源码)

2023-09-29 20:30:00 4056

原创 目标检测算法-transformer系列-UP DETR(附论文和源码)

目标检测算法-transformer系列-UP DETR(附论文和源码)

2023-09-28 20:30:00 3327

原创 目标检测算法-transformer系列-Deformable DETR(附论文和源码)

目标检测算法-transformer系列-Deformable DETR(附论文和源码)

2023-09-27 20:30:00 3259

原创 NLP必读论文-BERT

BERT

2023-09-26 20:30:00 3128

原创 历年检测、分割、生成算法梳理(2023)

专注“人工智能与图像处理”技术分享!

2023-09-24 19:30:00 4861

原创 目标检测算法-transformer系列-DETR论文解析(附论文与源码)

目标检测算法-transformer系列-DETR论文解析(附论文与源码)

2023-09-23 11:00:00 5026

原创 TransFormer-Attention Is All You Need

Transformer 模型详解

2023-09-22 16:50:13 4868

原创 目标检测算法-YOLOV8解析(附论文和源码)

目标检测算法-YOLOV8解析(附论文和源码)

2023-06-30 21:30:00 21166

原创 目标检测算法-YOLOV7解析(附论文与源码)

目标检测算法-YOLOV7解析(附论文与源码)

2023-06-29 21:30:00 5139

原创 目标检测算法-YOLOV6解析(附论文与源码)

目标检测算法-YOLOV6解析(附论文与源码)

2023-06-28 21:30:00 1743

原创 目标检测算法-YOLOV5解析(附论文与源码)

目标检测算法-YOLOV5解析(附论文与源码)

2023-06-27 10:13:28 3322

原创 AnchorFree算法-CenterNet论文解析(附论文与源码)

CenterNet属于anchor-free系列的目标检测算法,相比于CornerNet做出了改进,使得检测速度和精度相比于one-stage和two-stage的框架都有不小的提高,尤其是与YOLOv3作比较,在相同速度的条件下,CenterNet的精度比YOLOv3提高了4个左右的点。

2022-01-18 17:44:24 2569

原创 AnchorFree算法-CornerNet论文解析(附论文与源码)

一、Anchor机制存在的问题(if 已了解:欢迎绕道至二、~~)嗯,我们知道,常见的目标检测分为两个流派:one-stage,two-stage。one-stage中,网络会在原图上提出很多预先设定的粗略的anchors,在最后输出的结果中利用回归loss来修正这些anchorstwo-stage中,还是会提出很多预先设定的anchors,然后利用RPN(Region Proposal Networks)来对这些anchors进行初步的筛选和修正,从而得到一些用于下一阶段检测的候选框..

2021-10-20 09:46:51 2981

原创 场景文本检测算法-MSR论文解析

场景文本检测算法-MSR论文解析(人工智能与图像处理)https://mp.weixin.qq.com/s/A9veMKDVtwXEtzaIZ91y8A

2021-10-16 13:13:06 3695

原创 PSENet论文阅读笔记(附论文和源码地址)

论文地址:https://arxiv.org/pdf/1806.02559.pdf论文源码:https://github.com/whai362/psenetPSENet论文全称:Shape Robust Text Detection with Progressive ScaleExpansion Network .作者是旷视科技,PSENet2018年7月发表于arxiv,CVPR 2019 接收。论文作者来自南京理工大学和南京大学,其中第一作者来自南理工杨健老师PCALab组。0,前言.

2021-03-25 10:45:52 4834

转载 DBNet论文阅读笔记(附论文和源码地址)

DBNet论文阅读笔记(附论文和源码地址)

2020-11-27 08:00:15 1554

转载 图像分割算法概述(附论文地址)

图像分割算法概述(附论文地址)

2020-11-27 07:58:43 874

原创 MaskRCNN做文本检测?你试过吗?

之前用MaskRCNN检测了版面图片中的图片、表格、公式,整体效果还可以,想想能不能对MaskRCNN稍作修改,让它来检测文本行?带着这个好奇心,我出发了。第一步,标注数据 目前来说,数据是学习DL的重要资源,没有数据,只能算理论上了解DL,用实际数据实践是学习巩固DL理论知识的重要一环。 下面是将版面图片中的文本行标注后的结果。第二步,改动代码&训练此步省略...第三步,测试结果...

2020-11-14 22:49:43 1442 3

原创 MaskRCNN在多个实例数据集上实践

MaskRCNN没有FasterRCNN、YOLOv3好训练

2020-11-10 13:52:10 1710 16

原创 卷积的时候需要对卷积核进行180的旋转,你知道吗?

这个问题我之前是有过疑问的,后来不知道又取消了这个疑问。今天又去看了一下github上的那篇文章:DeepLearning-500-questions/ch05_卷积神经网络(CNN)/第五章_卷积神经网络里面有这么一段卷积的时候需要对卷积核进行180的旋转!这个和平时想的有点不一样啊,平时看到的文章不都是那卷积核直接和图像做卷积的吗?网上搜到的卷积操作绝大部分是这样介绍的,拿着卷积核直接和原图进行卷积计算就行了。实际不是这么回事!上面这张图的卷积核已经是原卷积核逆时

2020-09-16 16:57:08 4147

原创 EAST文本块图片文本检测实践

uNet源码解析

2020-08-03 20:20:59 1211

原创 CTPN文本块图片文本检测实践

CTPN自然场景实践

2020-07-19 15:54:46 439

转载 TensorFlow_2学习率

TensorFlow学习系列:TensorFlow_1参数初始化方法TensorFlow_2学习率TensorFlow_3激活函数TensorFlow_4正则化TensorFlow_5dropoutTensorFlow_6断点续训与Tensorboard可视化TensorFlow_7优化器TensorFlow_8损失函数转载别人的,动手整理一遍,同时把代码...

2020-05-09 10:19:02 2708 3

原创 深度学习相关资源链接-1

目录1,教程2,视频资源3,公开数据集4,项目5,论文1,教程Topal的深度学习教程,从感知机到深度神经网络:http://www.toptal.com/machine-learning/an-introduction-to-deep-learning-from-perceptrons-to-deep-networksUFLDL教程:主要介绍了介绍无监督...

2020-04-17 14:08:55 1016

原创 TensorFlow2.0学习笔记2-tf2.0两种方式搭建神经网络

一,TensorFlow2.0搭建神经网络八股六步法:1)import 【引入相关模块】2)train,test 【告知喂入网络的训练集测试集以及相应的标签】3)model=tf.keras.models.Sequential 【在Sequential中搭建网络结构,相当于走一遍前向传播】model=tf.keras.models.Sequential([]网络结构) ...

2020-03-13 20:15:24 5759

原创 文字识别/文本检测数据集

https://zhuanlan.zhihu.com/p/386553691、Chinese Text in Wild (CTW)32285张图像,1018402个中文字符(来自于腾讯街景);包含平面文本,凸起文本,城市文本,农村文本,低亮度文本,远处文本,部分遮挡文本。图像大小2048*2048,数据集大小为31GB。(8:1:1)比例训练集(25887张图像,812...

2020-03-09 17:38:19 4785

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除