deep learning_lykffl的博客-CSDN博客

deep learning

关注

文章平均质量分 88

关注数：文章数：30 文章阅读量：52072 文章收藏量：453

作者: lykffl

这个作者很懒，什么都没留下…

展开

速收藏！万字长文，科普人脸识别算法及系统

人脸检测、人脸对齐、人脸识别、人脸追踪、质量评估、活体检测等技术综述

转载 2022-07-07 09:37:46 · 1195 阅读 · 0 评论
收藏 360数科夺得OCR国际技术竞赛冠军，商超小票文本行识别如何做到最佳？

OCR SROIE2019 更关注商超小票文本行检测、识别和信息抽取冠军

转载 2022-07-04 16:51:26 · 253 阅读 · 0 评论
收藏从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks

kaggle 图像分割技巧总结

转载 2022-07-04 10:50:46 · 189 阅读 · 0 评论
浅谈图像分割调优 —— 服饰抠图

收藏服饰抠图图像分割

转载 2022-06-09 09:36:16 · 764 阅读 · 1 评论
收藏打架识别冠军方案｜极市打榜

一、前言作为一个刚走上工作岗位的打工人，算法研究与落地的差异性是首先需要学习与适应的。在周末的网上冲浪中，偶然发现了极市平台，其中有不少计算机视觉比赛以及项目招募，这些基本都是针对计算机视觉技术落地应用，还有丰厚的奖励～于是就抱着试试看的想法接触了一下。后来，极市平台推出了一种新的项目合作模式，即极市打榜。我第一次参与时选择了打架识别这一榜单，按照平台学习、算法调研、模型训练、测试优化等步骤完成了打榜过程，达到了0.96的分数，虽然后来被人超越了哈哈。详见极市打榜平台：https://www

转载 2022-04-25 09:26:02 · 2215 阅读 · 6 评论
收藏抗击新冠病毒之佩戴口罩检测技术综述

B. Wang, J. Zheng, and C. L. Philip Chen*, "A Survey on Masked Facial Detection Methods and Datasets for Fighting Against COVID-19", IEEE Transactions on Artificial Intelligence, Early Access, 2022.计算机视觉研究院专栏作者：Edison_G新冠病毒自爆发以来持续给世界造成巨大挑战。为...

转载 2022-04-24 09:52:42 · 680 阅读 · 0 评论
收藏 90+深度学习开源数据集整理｜包括目标检测、工业缺陷、图像分割等多个方向

小目标检测1.AI-TOD航空图像数据集数据集下载地址：http://m6z.cn/5MjlYkAI-TOD 在 28,036 张航拍图像中包含 8 个类别的 700,621 个对象实例。与现有航拍图像中的目标检测数据集相比，AI-TOD 中目标的平均大小约为 12.8 像素，远小于其他数据集。图片2.iSAID航空图像大规模数据集数据集下载地址：http://m6z.cn/6nUrYe现有的 Earth Vision 数据集要么适用于语义分割，要么适用于对象检测。iSAID

转载 2022-04-24 09:26:50 · 10238 阅读 · 1 评论
收藏小目标检测、图像分类、图像识别等开源数据集汇总

导读本文收集整理了多个小目标检测、图像识别、图像分类等方向的开源数据集，本次还有猫咪、斯坦福狗狗数据集以及3D MNIST数字识别等～宠物图像数据集数据集下载地址：http://m6z.cn/5TAgdC一个包含 37 个类别的宠物数据集，每个类别大约有 200 张图像。这些图像在比例、姿势和照明方面有很大的变化。所有图像都有相关的品种、头部 ROI 和像素级三元图分割的地面实况注释。街景门牌号 (SVHN) 数据集数据集下载地址：http://m6z.cn/5ExMWb.

转载 2022-04-01 09:43:22 · 652 阅读 · 0 评论
ECV 2021 冠军方案解读：占道经营识别方案

极市导读本文为获得占道经营识别冠军的威富团队方案解读，团队选用了基于YOLOv5的one-stage检测框架，最后达到了104.3FPS>>加入极市CV技术交流群，走在计算机视觉的最前沿我们参加了反光衣识别、驾驶员不良驾驶识别、船只数量检测、机动车识别、占道经营检测和电动车进电梯检测，下面以占道经营为例介绍整个情况。团队介绍团队来自深圳市威富视界有限公司&中国科学院半导体研究所高速电路与神经网络实验室，成员分别为宁欣、石园、荣倩倩，排名不分先后。ECV 20.

转载 2021-11-23 20:20:10 · 1545 阅读 · 3 评论
厉害了首届 SoMoF人体序列预测比赛冠军方案分享

近日阿里巴巴淘系技术多媒体算法团队的同学，以大幅领先第二名的成绩获得了在 ICCV2021 上举办的第一届室外场景下的人体轨迹预测比赛（ SoMoF Challenge ）的冠军，同时比赛论文被该 Workshop 接收。作为计算机视觉领域的三大顶级会议之一， ICCV 是每年学界的重要事件。ICCV 全称为International Conference on Computer Vision ，中文为国际计算机视觉大会。这个会议是由 IEEE 主办的全球最高级别学术会议，每两年在世界范围...

转载 2021-11-12 10:09:52 · 201 阅读 · 0 评论
深度学习数据增强工具 albumentations 的使用

简介 & 安装官方文档 albumentationsalbumentations 是一个给予 OpenCV的快速训练数据增强库，拥有非常简单且强大的可以用于多种任务（分割、检测）的接口，易于定制且添加其他框架非常方便。它可以对数据集进行逐像素的转换，如模糊、下采样、高斯造点、高斯模糊、动态模糊、RGB转换、随机雾化等；也可以进行空间转换（同时也会对目标进行转换），如裁剪、翻转、随机裁剪等。github及其示例地址如下：GitHub： https://github.com/album

转载 2021-11-12 09:36:30 · 3848 阅读 · 1 评论
深度学习中的人体姿态估计概述收藏

人体姿势骨架以图形格式表示人的方向。本质上，它是一组可以连接起来描述人的姿势的坐标。骨架中的每个坐标都称为零件（或关节或关键点）。两个部分之间的有效连接称为一对（或肢体）。请注意，并非所有零件组合都会产生有效的配对。下面显示了一个示例人体姿势骨架。左：人体姿势骨架的 COCO 关键点格式。右图：渲染的人体姿势骨架。多年来，人们引入了几种人体姿势估计方法。最早（也是最慢）的方法通常是在只有一个人的图像中估计单个人的姿势。这些方法通常首先识别各个部分，然后在它们之间形成连接以创建姿势。自然，这.

转载 2021-10-28 14:11:24 · 1045 阅读 · 0 评论
最全综述 | SLAM中回环检测方法收藏

在视觉SLAM问题中，位姿的估计往往是一个递推的过程，即由上一帧位姿解算当前帧位姿，因此其中的误差便这样一帧一帧的传递下去，也就是我们所说的累积误差。一个消除误差有效的办法是进行回环检测。回环检测判断机器人是否回到了先前经过的位置，如果检测到回环，它会把信息传递给后端进行优化处理。回环是一个比后端更加紧凑、准确的约束，这一约束条件可以形成一个拓扑一致的轨迹地图。如果能够检测到闭环，并对其优化，就可以让结果更加准确。在检测回环时，如果把以前的所有帧都拿过来和当前帧做匹配，匹配足够好的就是回环，但这样会导致

转载 2021-10-09 16:20:06 · 4631 阅读 · 0 评论
记一次坎坷的算法需求实现：轻量级人体姿态估计模型的修炼之路（附MoveNet复现经验）收藏

一、需求背景这天接到个新需求，需要实时检测自然场景下目标人体的关键点位置。从算法工程师的角度来拆解下需求：1、检测人体关键点位置，就是人体姿态估计任务嘛；2、要实时，那么就是终端部署，服务端那传输延时就不考虑了。对了咱们硬件不大行，所以肯定是要轻量级模型的，分辨率也不能太大，剪枝量化蒸馏三件套也要做好打算；3、“自然场景下的目标人体”，意思就是场景下可能有多人，但是我们只需要一个目标的关键点，要考虑如何区分（这点后面再展开说）。二、方案探索2.1 初见之前的项目经验主要是人脸

转载 2021-09-28 09:36:38 · 822 阅读 · 3 评论
神经网络调参经验大汇总收藏

极市导读本文为特斯拉高级总监Andrej Karpathy关于神经网络调参经验的总结，为了更好的训练神经网络，作者为自己定制了一套具体的流程。通过阅读本文能给大家的调参大幅提高效率。>>加入极市CV技术交流群，走在计算机视觉的最前沿今天看到一篇非常非常棒的调节NN的文章，作者是特斯拉高级总监Andrej Karpathy，就翻译过来和大家一起分享，难免翻译有问题，有兴趣的朋友可以去引文阅读原文。为了能更好地训练NN，karpathy为自己定制了一套具体的流程。在每次用NN处理一个新.

转载 2021-09-07 20:25:15 · 390 阅读 · 0 评论
一文总结旋转目标检测全面综述：论文方法与代码值得收藏

首先放上DOTA数据集官网（http://captain.whu.edu.cn/DOTAweb/index.html），官网提供水平和旋转目标提交接口，可以看到检测结果实时排行榜（http://captain.whu.edu.cn/DOTAweb/results.html），目前前五名分别来自武汉大学夏桂松团队、南京理工大学pca_lab、Cyber 公司、中科院电子所以及阿里idst。点开前面加号可以看到有的团队的方法介绍。DOTA旋转目标赛道实时排名（2019年12-22）以下方法介绍按照论文提

转载 2021-08-23 09:40:30 · 374 阅读 · 0 评论
2021年小目标检测最新研究综述很全面值得收藏

摘要小目标检测长期以来是计算机视觉中的一个难点和研究热点。在深度学习的驱动下，小目标检测已取得了重大突破，并成功应用于国防安全、智能交通和工业自动化等领域。为了进一步促进小目标检测的发展，本文对小目标检测算法进行了全面的总结，并对已有算法进行了归类、分析和比较。首先，对小目标进行了定义，并概述小目标检测所面临的挑战。然后，重点阐述从数据增强、多尺度学习、上下文学习、生成对抗学习以及无锚机制等方面来提升小目标检测性能的方法，并分析了这些方法的优缺点和关联性。之后，全面介绍小目标数据集，并在一些常用的公共数

转载 2021-08-11 09:37:19 · 5204 阅读 · 1 评论
Github标星13.6k ！一行代码从PDF提取Excel文件，太强了！

代表了文档布局及内容识别的一类方法，值得收藏！导读相信大家在工作生活中经常会遇到表格识别的问题，比如导师说，把下面PDF文件里面的表格取出来整理成Excel表。也可能会遇到，公司领导或者客户发来一张截图，需要里面的表格取出来转成Excel表。这种情况下你会怎么做呢，新建一个Excel一个一个数据敲么，辛辛苦苦半天赶出来，领导还会来一句，怎么这么慢，简直郁闷死……别着急，只要稍微会一点Python代码，这个开源项目神器拯救你！效..

转载 2021-08-10 10:17:34 · 245 阅读 · 0 评论
5%的时间做算法，95%的时间做工程

探讨一下算法工程师的工作体验问题。1. 一地鸡毛的现实从我最近几年观察来看，在很多算法团队，算法工程师不是算法工程师，更像是运营开发工程师或者业务规则工程师（当然也有不少团队不是这样的）。“根本不是来提特征调模型的，是来实现业务规则的”，“5%的时间做算法，95%的时间干工程”，“拉通数据花了我2周，模型训练一天搞定”。这些都是算法工程师常见的体验。看得开的会说，“这也许就是工业界的现实吧？”，看不开的则会说，“这也许就是工业界的现实吧！”。2. 应然和实然的冲突

转载 2021-08-03 13:57:46 · 126 阅读 · 0 评论
综述|姿态估计方法大盘点

Introduction顾名思义，通过姿势估计，我们尝试从图像中推断出物体或人的姿势。这涉及识别和定位身体上的关键点。由于身体的小关节、遮挡和缺乏上下文、旋转和方向，关键点的识别是一项非常具有挑战性的任务。在本文其余部分将主要关注人体姿势估计的情况下，膝盖、肘部、肩部和手腕等主要关节代表这些关键点。在分类方面，姿态估计器可以分为以下几类：维度（2D 与 3D）单姿势和多姿势（检测一个或多个物体）方法论（基于关键点与基于实例）我们可以使用 2D 姿

转载 2021-08-02 09:36:52 · 4201 阅读 · 1 评论
基于姿态估计的运动计数APP开发

一前言：看着自己日渐发福的身材，回想当年的英姿煞爽，感慨颇多。作为一个有羞耻心的程序猿，我决定开始减肥。考察了数十项减肥项目，我选择了仰卧起坐。因为它场地限制小，时间限制短，不剧烈，不伤身，最关键的是能够一边看综艺，一边锻炼，简直妙不可言！试行了几天之后发现有一个比较棘手的问题，做着做着，就忘了做了多少个，一脸懵逼，万般无奈，于是便有了这个运动计数APP的灵感。不用太花哨的功能，最最简单的一点，能够对我的仰卧起坐进行计数，并显示在APP的界面上，到了10，20这种(%10==0)的关键节点上...

转载 2021-07-27 11:34:22 · 1573 阅读 · 2 评论
传统方法 + 深度学习发威！ | 2021瓷砖缺陷检测总决赛冠军思路分享

本文整理天池比赛论坛分享：https://tianchi.aliyun.com/forum/postDetail?postId=195955仅做收藏、学术分享一. 总体方案概述虽然当前深度学习技术十分火爆，但它占AOI落地项目中的比例仅约10%。传统算法依然无法被完全取代，它有着计算复杂度低、调试成本低等优点。为了结合深度学习算法和传统算法的优势，我们提出Deep and Shallow Fusion Network (DSFNet), 该网络将传统算法提取的特征在模型的深层和浅层按

转载 2021-07-23 09:39:42 · 510 阅读 · 0 评论
实时车道线检测和智能告警 | 车距 + 弯道 + 车道线

导读车道线检测 + 距离告警 + 转弯曲率半径计算。代码：https://github.com/MaybeShewill-CV/lanenet-lane-detection来自模型的车道线预测介绍自动驾驶将在未来十年给旅行带来革命性的变化。目前，自动驾驶应用正在进行各种应用案例的测试，包括乘用车、机器人出租车、自动商业送货卡车、智能叉车和用于农业的自动拖拉机。自动驾驶需要一个计算机视觉感知模块来理解和导航环境。感知模块的作用包括：检测车道线检测其他物体：车辆、人、环境

转载 2021-07-12 09:34:09 · 3099 阅读 · 2 评论
CVPR2021 FGVC8植物病理识别挑战赛，冠军方案解读

本文转载自DeepBlue深兰科技；个人转载仅做知识储备用。导读近日，在计算机视觉和模式识别领域的三大顶级会议之一CVPR上，深兰科学院的两支团队在FGVC8 (CVPR2021)中包揽了植物病理识别挑战赛的冠军和亚军，这也是深兰在该赛事中连续三年问鼎。今年该挑战赛共有来自全球的626支团队参加角逐，竞争异常激烈。FGVC全称为Fine-Grained Visual Categorization（细粒度图像分类），今年是举办的第8届比赛，不同于传统的广义上的分类任务，FGVC的挑战致

转载 2021-07-08 09:12:04 · 694 阅读 · 0 评论
一文梳理水下检测方法

水下目标检测旨在对水下场景中的物体进行定位和识别。这项研究由于在海洋学、水下导航等领域的广泛应用而引起了持续的关注。但是，由于复杂的水下环境和光照条件，这仍然是一项艰巨的任务。因此近年来有多个赛事与水下目标检测相关，如近期正在进行的2021全国水下机器人大赛，接下来我们将介绍在水下目标检测领域的深度学习方法概述。01水下目标检测的关键问题1.1 水下图片模糊在水下场景中，由于光照影响大大降低了水下图像的质量，从而导致了可见度损失，弱对比度和纹理失真，颜色变化...

转载 2021-04-22 18:13:34 · 1827 阅读 · 0 评论
Kaggle竞赛中使用YOLOv5将目标检测的性能翻倍的心路历程

导语：本文的原作者是一位名叫Mostafa Ibrahim的外国友人，简要记录了其在参加kaggle目标检测比赛中，从建立基线到一步一步的优化过程，最终将performance提升了一倍，我觉得是一篇非常好的竞赛经验总结文章，最后还提供了github代码地址，非常良心，所以跟大家分享。我花了三个月的时间深入研究物体检测。我尝试了很多方法，从实现最先进的模型，如YoloV5、VFNets、DETR，到将目标检测模型与图像分类模型融合以提高性能。在比赛的早期阶段，我努力提高基准模型的分数，但我找不到有用的在线

转载 2021-04-22 17:57:25 · 951 阅读 · 0 评论
深度学习检测小目标常用方法

## 引言在深度学习目标检测中，特别是人脸检测中，小目标、小人脸的检测由于**分辨率低，图片模糊，信息少，噪音多**，所以一直是一个实际且常见的困难问题。不过在这几年的发展中，也涌现了一些提高小目标检测性能的解决手段，本文对这些手段做一个分析、整理和总结。**欢迎探讨，本文持续维护。**## 实验平台N/A## 传统的图像金字塔和多尺度滑动窗口检测最开始在深度学习方法流行之前，对于不同尺度的目标，大家普遍使用将原图build出**不同分辨率的图像金...

转载 2020-11-11 20:46:47 · 677 阅读 · 0 评论
CVPR2020 夜间目标检测挑战赛冠军方案解读

本文转载自DeepBlue深兰科技在 CVPR 2020 Workshop 举办的NightOwlsDetection Challenge 中，来自国内团队深兰科技的 DeepBlueAI 团队斩获了“单帧行人检测”和“多帧行人检测”两个赛道的冠军，以及“检测单帧中所有物体”赛道的亚军。竞赛的主要目的是进行夜间行人或物体检测，是许多系统，尤其是自动驾驶汽车安全可靠的关键之一。众所周知，熊猫智能公交车是深兰科技自动驾驶核心产品，自2019年获得了广州、长沙、上海、武汉的自...

转载 2020-09-23 21:24:35 · 441 阅读 · 0 评论
结合caffe SSD源码，解析目标检测SSD的数据增强操作

一、distort distort_param { brightness_prob: 0.5 brightness_delta: 32 contrast_prob: 0.5 contrast_lower: 0.5 contrast_upper: 1.5 hue_prob: 0.5 hue_delta: 18 saturat...

原创 2018-07-09 23:21:53 · 1759 阅读 · 0 评论
关闭caffe终端输出log

使用caffe做DL时，他的log输出信息对于训练时作用很大，但是对于应用完全没必要，可以在caffe调用程序中加入一句话关闭caffe::GlobalInit(&argc,&argv);argc,argv时main函数的输入参数

原创 2017-04-27 17:26:59 · 1745 阅读 · 0 评论

deep learning

作者: lykffl

速收藏！万字长文，科普人脸识别算法及系统

收藏 360数科夺得OCR国际技术竞赛冠军，商超小票文本行识别如何做到最佳？

收藏 从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks

浅谈图像分割调优 —— 服饰抠图

收藏 打架识别冠军方案｜极市打榜

收藏 抗击新冠病毒之佩戴口罩检测技术综述

收藏 90+深度学习开源数据集整理｜包括目标检测、工业缺陷、图像分割等多个方向

收藏 小目标检测、图像分类、图像识别等开源数据集汇总

ECV 2021 冠军方案解读：占道经营识别方案

厉害了 首届 SoMoF人体序列预测比赛冠军方案分享

深度学习数据增强工具 albumentations 的使用

深度学习中的人体姿态估计概述 收藏

最全综述 | SLAM中回环检测方法 收藏

记一次坎坷的算法需求实现：轻量级人体姿态估计模型的修炼之路（附MoveNet复现经验） 收藏

神经网络调参经验大汇总 收藏

一文总结旋转目标检测全面综述：论文方法与代码 值得收藏

2021年小目标检测最新研究综述 很全面值得收藏

Github标星13.6k ！一行代码从PDF提取Excel文件，太强了！

5%的时间做算法，95%的时间做工程

综述|姿态估计方法大盘点

基于姿态估计的运动计数APP开发

传统方法 + 深度学习发威！ | 2021瓷砖缺陷检测总决赛冠军思路分享

实时车道线检测和智能告警 | 车距 + 弯道 + 车道线

CVPR2021 FGVC8植物病理识别挑战赛，冠军方案解读

一文梳理水下检测方法

Kaggle竞赛中使用YOLOv5将目标检测的性能翻倍的心路历程

深度学习检测小目标常用方法

CVPR2020 夜间目标检测挑战赛冠军方案解读

结合caffe SSD源码，解析目标检测SSD的数据增强操作

关闭caffe终端输出log

收藏从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks

收藏打架识别冠军方案｜极市打榜

收藏抗击新冠病毒之佩戴口罩检测技术综述

收藏小目标检测、图像分类、图像识别等开源数据集汇总

厉害了首届 SoMoF人体序列预测比赛冠军方案分享

深度学习中的人体姿态估计概述收藏

最全综述 | SLAM中回环检测方法收藏

记一次坎坷的算法需求实现：轻量级人体姿态估计模型的修炼之路（附MoveNet复现经验）收藏

神经网络调参经验大汇总收藏

一文总结旋转目标检测全面综述：论文方法与代码值得收藏

2021年小目标检测最新研究综述很全面值得收藏