![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
人工智
白大力
这个作者很懒,什么都没留下…
展开
-
人工智能专题-目标定位
引言目标定位是图像处理或计算机视觉系统(如目标检测与分类,证件识别等)的第一步。任何计算机视觉系统都显性或隐性的包含着目标定位的步骤。目标定位的方法有传统方法和基于卷积神经网络的深度学习方法,本文主要讨论后者。深度学习方法有更好的鲁棒性(robustness),对各种问题实现形式统一,无需人为设定参数,无需太多的图像处理知识等优点。问题的定义目标定位解决的是在一张图像中找到我们感兴趣的原创 2018-01-28 12:58:58 · 2907 阅读 · 0 评论 -
非极大抑制算法-NMS
非极大抑制算法顾名思义就是抑制那些非极大的选项。对于目标检测,非极大抑制算法根据两个条件来抑制候选窗口:1. 同类预测条件下置信度低的窗口2. 与置信度高的窗口IOU高的窗口举例来说上图中左边是候选窗口,右边是选出后的结果。左边候选窗口都以相对高的置信度预测出人脸,其中右图绿色对应的窗口置信度最高,这是满足条件1。并且置信度相对低的那些窗口与置信度高的绿色窗口的IOU高原创 2018-02-07 00:06:30 · 293 阅读 · 0 评论 -
卷积神经网络(CNN)
卷积层从线性代数的角度看卷积层可看做是有强限制的全连层。这有助于理解梯度下降优化和反响传播。从信号与系统的角度看卷积层相当于一个系统,卷积核就是系统的单位冲激响应。激活函数激活函数相当于放大器?二极管,三极管之类的东西?池化层信号与系统的角度看池化层就是抽样本。原创 2018-02-07 00:15:25 · 193 阅读 · 0 评论 -
【论文解读】MORAN: A Multi-Object Rectified Attention Network for Scene Text Recognition
MORAN: A Multi-Object Rectified Attention Network for Scene Text Recognition这篇论文提出了自然场景下弯曲文字识别的一种网络MORAN。MORAN 由两个部分组成:一个是弯曲矫正网络MORN,一个是识别网络ASRN。弯曲矫正网络MORNMORN(Multi-Object Rectification...原创 2019-01-18 01:56:21 · 3262 阅读 · 0 评论 -
腾讯最新人脸检测模型DSFD: Dual Shot Face Detector
【LearnX导读】人脸检测是人脸相关应用中必不可少的一环。如我们熟悉的刷脸解锁,美颜相机,刷脸支付等都离不开人脸检测。这篇文章写的就是提高人脸检测准确度的方法。这篇文章从特征抽取,锚匹配(Anchor matching),损失函数三个方面研究人脸检测模型,相应的提出更强的特征学习模块EFM,更有效的锚匹配IAM,更有效的损失函数PAL来提高人脸检测的准确度。该方法在主流的人脸检测基准数据...原创 2019-06-28 22:22:52 · 3298 阅读 · 0 评论