• 博客(119)
  • 资源 (45)
  • 收藏
  • 关注

原创 CVPR2019目标检测方法进展综述

SIGAI特约作者陈泰红研究方向:机器学习、图像处理目标检测是很多计算机视觉应用的基础,比如实例分割、人体关键点提取、人脸识别等,它结合了目标分类和定位两个任务。现代大多数目标检测器的框架是 two-stage,其中目标检测被定义为一个多任务学习问题:1)区分前景物体框与背景并为它们分配适当的类别标签;2)回归一组系数使得最大化检测框和目标框之间的交并比(IoU)或其它指标。最后,通过一个 ...

2019-03-20 14:14:04 13531 1

原创 论文解读: Quantized Convolutional Neural Networks for Mobile Devices

CNN网络在许多方面发挥着越来越重要的作用,但是CNN模型普遍很大,计算复杂,对硬件的要求很高,这也是限制CNN发展的一个因素。在这篇论文中,作者提出了一个加速和压缩CNN的方法——Quantized CNN,主要思想是对卷积层和全连接层中的权重进行量化,并最小化每层的响应误差。作者也在ILSVRC-12上做了大量的实验,证明对于分类任务在仅损失很小的准确率下,该方法可以达到4-6倍的加速,和15...

2019-03-04 18:35:29 2329

原创 理解熵和交叉熵

作者简介:SIGAI人工智能平台(www.sigai.cn)本文PDF版下载地址:http://www.sigai.cn/paper_80.htmlXGBoost是当前炙手可热的算法,适合抽象数据的分析问题,在Kaggle等比赛中率获佳绩。市面上虽然有大量介绍XGBoost原理与使用的文章,但少有能清晰透彻的讲清其原理的。本文的目标是对XGBoost的原理进行系统而深入的讲解,帮助大家真正理解...

2019-01-19 16:55:27 3374 3

原创 理解EM算法

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。[书的购买链接](https://item.jd.com/12685964.html?dist=jd)[书的勘误,优化,源代码资源](http://www.tensorinfinity.com/paper_78.html)EM( expectatio...

2019-01-15 11:57:40 2938

原创 轻量化神经网络综述

陈泰红研究方向:机器学习、图像处理其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源导言深度神经网络模型被广泛应用在图像分类、物体检测等机器视觉任务中,并取得了巨大成功。然而,由于存储空间和功耗的限制,神经网络模型在嵌入式设备上的存储与计算...

2018-09-28 10:33:28 15056

原创 机器学习与深度学习核心知识点总结 写在校园招聘即将开始时

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源导言一年一度的校园招聘就要开始了,为了帮助同学们更好的准备面试,SIGAI 在今天的公众号文章中对机器学习、深度学习的核心知识点进行了总结。希望我们的文章能够帮助你顺利的通过技术面试,如果你对这些问题有什么疑问,...

2018-08-09 14:34:52 2246

原创 反向传播算法推导-卷积神经网络

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源导言–在SIGAI之前的公众号文章“反向传播算法推导-全连接神经网络”中,我们推导了全连接神经网络的反向传播算法。其核心是定义误差项,以及确定误差项的递推公式,再根据误差项得到对权重矩阵、偏置向量的...

2018-08-08 11:57:32 7002 2

原创 机器学习算法地图

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源文章《机器学习算法地图》系SIGAI原创,仅供个人学习使用,未经允许,不得转载,不能用于商业目的。如需获取原版PDF全文,可搜索关注VX公众号SIGAICN。(https://0x9.me/dxRg5)...

2018-07-05 12:10:07 6566 4

原创 卷积神经网络的压缩和加速

原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不能用于商业目的。其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源相关背景为什么要对网络进行压缩和加速呢?最实际的原因在于当前存储条件和硬件的计算速度无法满足复杂网络...

2018-06-26 10:29:21 9481 1

原创 《机器学习-原理、算法与应用》出版了

为什么要写本书?本书的前身为《机器学习与应用》,雷明著,清华大学出版社。在第一版的基础上做了大幅度优化,并经过反复校对,最终形成此书。由于之前是第一次写书,缺乏经验,导致了书的内容过多,里面存在大量开源库代码占据篇幅。这一版改进了这些问题,且增加了不少新的内容,更为系统和全面,品质也得到了不小的提升。SIGAI微信公众号自去年4月份发布第一篇文章“机器学习-波澜壮阔40年”起,到今天为止,已...

2019-11-07 14:56:49 5851 3

原创 论文解读 Receptive Field Block Net for Accurate and Fast Object Detection

论文解读 Receptive Field Block Net for Accurate and FastECCV 2018随着深度神经网络的发展,目前性能最佳的目标检测模型都依赖于深度的CNN主干网,如ResNet-101和Inception,虽然强大的特征表示有利于性能的提升,但却带来高额的计算成本。相反的,一些轻量级的检测模型可以实时的处理检测问题,但随之带来的是精度的牺牲。在这篇论文文中,作者探索了一种替代方案,通过使用人工设计的网络模块(hand-crafted mechanism)

2019-03-01 17:39:03 3291 2

原创 机器学习中的编码器-解码器结构哲学

机器学习中体现着各种工程和科学上的哲学思想,大的有集成学习,没有免费午餐,奥卡姆剃刀;小的有最大化类间差异、最小化类内差异。对于很多问题,存在着一类通行的解决思路,其中的一个典型代表就是“编码器-解码器”结构。这一看似简单的结构,背后蕴含的工程思想却非常值得我们学习和品味。

2019-02-27 17:50:43 21456

原创 【论文解读】如何让CNN高效地在移动端运行

尽管最新的高端智能手机有强大的CPU和GPU,但是在移动设备上运行复杂的深度学习模型(例如ImageNet分类模型)仍然十分困难。为了可以将深度网络模型应用于移动设备,本文提出了一个简单且有效的压缩整个CNN模型的方案,称为“one-shot whole network compression”,该方案包括三个步骤:a)利用VBMF(Variational Bayesian Matrix Factorization)选择合适的秩。b)对卷积核做Tucker分解。c)参数微调(fine-tune)恢复准确率。

2019-02-22 18:22:59 1681 1

原创 CornerNet: Detecting Objects as Paired Keypoints论文解读

#### 作者简介:SIGAI人工智能平台全文PDF下载:http://sigai.cn/paper_101.html本文提出一种使用单个卷积神经网络的新型物体检测方法: CornerNet.本文通过将目标定义为成对关键点,消除了单阶段检测网络中对anchor box的需要. 除了新颖的网络形式外,本文还介绍了角落池化(corner pooling):一种新的池化方式,它可以帮助网络更好地定位...

2019-02-21 11:45:34 1467

原创 2018年国外主要实验室和科研团队成果和动向

2018年国外主要大牛和实验室动向和成果

2019-02-15 17:08:08 2417

原创 理解隐马尔可夫模型

作者简介:SIGAI人工智能平台全文PDF下载:http://www.sigai.cn/paper_99.html隐马尔可夫模型(Hidden Markov Model,简称HMM)由Baum等人在1966年提出[1],是一种概率图模型,用于解决序列预测问题,可以对序列数据中的上下文信息建模。所谓概率图模型,指用图为相互依赖的一组随机变量进行建模,图的顶点为随机变量,边为变量之间的概率关系。...

2019-02-14 23:35:49 3000

原创 基于单目视觉的三维重建算法综述

作者:SIGAI特邀作者陈泰红PDF地址:http://sigai.cn/paper_97.html三维计算机视觉在计算机视觉是偏基础的方向,随着2010年阿凡达在全球热映以来,三维计算机视觉的应用从传统工业领域逐渐走向生活、娱乐、服务等,比如AR/VR,SLAM,自动驾驶等都离不开三维视觉的技术。三维重建包含三个方面,基于SFM的运动恢复结构,基于Deep learning的深度估计和结构...

2019-01-28 17:30:25 8985 2

原创 哪些成为了经典-引用次数最多的10篇机器学习文献

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源近40年来机器学习领域产生了数以万计的论文,并以每年上万篇的速度增长。但真正能够称为经典、经受住历史检验、能投入实际应用的并不多。本文整理了机器学习历史上出现的经典论文,按照被引用次数对它们进行了排序,分为top10...

2019-01-23 16:03:09 1404

原创 弯曲文字检测之SPCNet

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源获取全文PDF请查看:弯曲文字检测之SPCNet一、简介文字检测在深度学习的推动下,最近几年取得了长足的进步。由于多媒体检索,工业自动化,视力障碍人士辅助设备等应用的需求日益增长,场景文本检测是的计...

2019-01-21 15:18:58 4959

原创 干货|手把手教你在NCS2上部署yolov3-tiny检测模型

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源获取全文PDF;请查看http://www.tensorinfinity.com/paper_68.html如果说深度学习模型性能的不断提升得益于英伟达GPU的不断发展,那么模型的边缘部署可能就需要借助英特尔的边...

2019-01-16 11:22:38 7271 8

原创 从安全视角对机器学习的部分思考

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源摘要近几年,机器学习的大规模应用,以及算法的大幅度提升,吸引了学术界、工业界以及国防部门的大量关注。然而,对于机器学习算法本身的局限性,由于其快速的发展也不断的暴露了出来。因此,不论是人工智能领域的学者,还...

2019-01-11 14:26:31 2214 1

原创 AI各领域产业发展现状

SIGAI推荐SIGAI资源汇总SIGAI人工智能平台全场六折智能医疗“So tomorrow, if AI can shape healthcare, it has to work through the regulations of healthcare … In fact, I see that as one of the biggest areas is w...

2019-01-09 15:04:05 5067

原创 【AAAI2019】【CVPR2018】最新 Video-based ReID 论文核心解读---附代码

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源SIGAI特约作者Fisher Yu@OuluCV在读博士研究方向:情感计算最近看了两篇 Video-based 的 ReID 文章,做下笔记简单对比下:第一篇CVPR2018 [1]:先对...

2019-01-07 15:30:38 3416

原创 视觉SLAM综述

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源什么是视觉SLAMSLAM是“Simultaneous Localization And Mapping”的缩写,可译为同步定位与建图。概率 SLAM 问题 (the probabilistic SLAM ...

2019-01-02 13:55:09 3396

原创 基于深度学习的细粒度图像分类综述

SIGAI特约作者卢宪凯上海交通大学在读博士其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源1.简介细粒度图像分类 (Fine-grained image categorization), 又被称作子类别图像分类 (Sub-category rec...

2019-01-02 09:49:03 6445

原创 [ECCV2018][端到端文字识别]

SIGAI特约作者谢恩泽同济计算机研三在读,face++研究实习生主要研究方向为目标检测,语义分割等其中包括文字检测和识别其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源前言:这篇文章是第一个做弯曲文本的端到端检测+识别。...

2018-12-28 11:35:59 1809

原创 2018顶会论文汇编

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源CVPR 2018大会时间:6月18日~22日会议地点:盐湖城,UTAH国际计算机视觉与模式识别会议(Conference on Computer Vision and Pattern Recogniti...

2018-12-27 13:59:57 6358

原创 工业界第一手实战经验:深度学习高效网络结构设计

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源SIGAI特约作者mileistone腾讯算法工程师研究方向:物体检测这一年来一直在做高效网络设计的工作,2018年即将结束,是时候写一篇关于高效网络设计的总结。首先看看当前业界几个最...

2018-12-24 17:28:54 1243 1

原创 视频理解 S3D,I3D-GCN,SlowFastNet, LFB

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源接着上次的《活体检测Face anti-spoofing综述》,再来讲讲arXiv上新挂的文章:最近看了下几篇动作识别,视频理解的文章,在这里记下小笔记,简单过一下核心思想,以便后续查阅及拓展使用。文章...

2018-12-19 15:24:56 7106

原创 2018 AI产业界大盘点

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源大事件盘点“1.24——Facebook人工智能部门负责人Yann LeCun宣布卸任Facebook人工智能研究部门(FAIR)的负责人Yann LeCun宣布卸任,之后将担任Facebook首席人工智能科...

2018-12-17 16:52:34 1472

原创 深入浅出对抗性机器学习(AML)

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源针对adversarial machine learning这个问题而言,AI出身的小伙伴们可能认为,这样的工作应该只能看做模型的鲁棒性或泛化能力不够强,但是从安全角度考虑,其实所谓的“安全”概念,是从模型的设计者角...

2018-12-17 11:34:08 3847

原创 从0到1:神经网络实现图像识别(中)

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源”. . . we may have knowledge of the past and cannot control it; we may control the future but have no knowl...

2018-12-12 14:53:55 4234 1

原创 视频语义分割介绍

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源摘要:随着深度学习的发展,图像语义分割任务取得了很大的突破,然而视频语义分割仍然是一个十分具有挑战性的任务,本文将会介绍视频语义分割最近几年顶会上的一些工作。1、基本任务介绍:语义分割任务要求给图像上的每...

2018-12-10 14:28:22 8158 4

原创 Eager Mode,写在TensorFlow 2.0 到来之前

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源本文主要讲解了在编写基于TensorFlow的应用过程中如何使用Eager Mode。内容主要包括 Eager Mode简介 Eager Mode下的自动求导 在Eager Mode下创建一...

2018-12-07 15:37:17 1224 1

原创 从0到1:神经网络实现图像识别(上)

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源纸上得来终觉浅,绝知此事要躬行。“神经网络”是“机器学习”的利器之一,常用算法在TensorFlow、MXNet计算框架上,有很好的支持。为了更好的理解与使用这件利器,我们可以不借助计算框架,从零开始,一步步...

2018-12-05 16:14:36 5397 2

原创 Large scale GAN training for high fidelity natural image synthesis解读

2018-12-04 10:29:57 1077

原创 理解计算:从根号2到AlphaGo番外篇——眼见未必为实--漫谈图像隐写术

有很多技术都致力于保护信息安全,其中有两类技术最为著名,一个是密码学,另一类就是密写术,也称为隐写术。应邀借此机会向大家谈谈隐写术这个很多人都不太熟悉的领域。本文将带领大家了解隐写技术发展的历史,现代隐写术的基本方法及问题。最重要的是,我将带领大家进一步了解是深度生成模型(生成对抗网络)技对隐写技术带来的影响。希望能通过对隐写领域的介绍,对大家在其他领域应用生成对抗网络有所启发。1 ...

2018-11-30 17:29:00 2149

原创 时空建模新文解读:用于高效视频理解的TSM

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源接着之前的《浅谈动作识别TSN,TRN,ECO》,来谈谈最近 MIT和IBM Watson 的新文 Temporal Shift Module(TSM)[1]。Something-SomethingV1...

2018-11-28 15:50:06 3218 2

原创 集成学习综述-从决策树到XGBoost

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源在之前缅怀金大侠的文章“永远的金大侠-人工智能的江湖”中提到:集成学习是机器学习中一种特殊的存在,自有其深厚而朴实的武功哲学,能化腐朽为神奇,变弱学习为强学习,虽不及武当和少林那样内力与功底深厚。其门下两个主要分支-...

2018-11-27 12:05:41 1350

原创 活体检测新文by京东金融:利用多帧人脸来预测更精确的深度

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接 书的勘误,优化,源代码资源接着上次的《活体检测Face anti-spoofing综述》,再来讲讲arXiv上新挂的文章:京东金融和中科院联合发表的“Exploiting temporal and depth information...

2018-11-21 12:04:05 17985

理解Spatial Transformer Networks

随着深度学习的不断发展,卷积神经网络(CNN)作为计算机视觉领域的杀手锏,在几乎所有视觉相关任务中都展现出了超越传统机器学习算法甚至超越人类的能力。一系列CNN-based网络在classification、localization、semantic segmentation、action recognization等任务中都实现了state-of-art的结果。

2018-08-13

机器学习和深度学习核心知识点总结

一年一度的校园招聘就要开始了,为了帮助同学们更好的准备面试,SIGAI 在今天的公众号文章中对机器学习、深度学习的核心知识点进行了总结。希望我们的文章能够帮助你顺利的通过技术面试,如果你对这些问题有什么疑问,可以关注我们的公众号,向公众号发消息,我们将会无偿为你解答。对于不想在近期内找工作的同学,阅读这篇文章,对加深和巩固机器学习和深度学习的知识也是非常有用的。

2018-08-13

反向算法推导-卷积神经网络

在今天这篇文章中,我们将详细为大家推导卷积神经网络的反向传播算法。对于卷积层,我们将按两条路线进行推导,分别是标准的卷积运算实现,以及将卷积转化成矩阵乘法的实现。在文章的最后一节,我们将介绍具体的工程实现,即卷积神经网络的卷积层,池化层,激活函数层,损失层怎样完成反向传播功能。

2018-08-13

基于深度神经网络的自动问答系统概述

问答系统的实现机制多种多样,基于信息检索 (IR: Information Retrieval) 的、基于问答知识库 (KB: Knowledge Base) 的、基于知识图谱 (KG: Knowledge Graph) 的等等,一个相对完善的问答系统往往是多种机制的组合。

2018-08-13

机器学习和深度学习中值得弄懂的一些问题

SIGAI飞跃计划第一期已经进行4周了,在这4周的学习中,同学们提出了不少好问题。在这里,我们将每周直播答疑的问题进行筛选和整理,写成今天的公众号文章,供大家参考。相信会对大家的学习和实践有所帮助!

2018-08-13

神经网络的激活函数总结

激活函数在神经网络中具有重要的地位。在SIGAI之前的公众号文章“理解神经网络的激活函数”中,我们回答了3个关键的问题: 为什么需要激活函数? 什么样的函数能用作激活函数? 什么样的函数是好的激活函数? 这篇文章从理论的角度介绍了激活函数的作用。承接上篇,在今天这篇文章中,SIGAI将为大家介绍当前深度学习中常用的一些激活函数,包括它们的工程实现。我们将以Caffe为例。

2018-08-13

传统图片检索技术的发展

今天我们来介绍一下图片检索技术,图片检索就是拿一张待识别图片,去从海量的图片库中找到和待识别图片最相近的图片。这种操作在以前依靠图片名搜图的时代是难以想象的,直到出现了CBIR(Content-based image retrieval)技术,依靠图片的内容去搜图。

2018-08-13

随机森林概述

随机森林由多棵决策树组成,采用多棵决策树联合进行预测可以有效提高模型的精度。这些决策树用对训练样本集随机抽样构造出的样本集训练得到。由于训练样本集由随机抽样构造,因此称为随机森林。随机森林不仅对训练样本进行抽样,还对特征向量的分量随机抽样,在训练决策树时,每次寻找最佳分裂时只使用一部分抽样的特征分量作为候选特征进行分裂。

2018-08-13

关于感受野的总结

感受野是卷积神经网络里面最重要的概念之一,为了更好地理解卷积神经网络结构,甚至自己设计卷积神经网络,对于感受野的理解是必备的。

2018-08-13

流形学习概述

在很多应用中,数据的维数会很高。以图像数据为例,我们要识别32x32的手写数字图像,如果将像素按行或者列拼接起来形成向量,这个向量的维数是1024。高维的数据不仅给机器学习算法带来挑战,而且导致计算量大,此外还会面临维数灾难的问题(这一问题可以直观的理解成特征向量维数越高,机器学习算法的精度反而会降低)。人所能直观看到和理解的空间最多是3维的,为了数据的可视化,我们也需要将数据投影到低维空间中,因此就需要有数据降维这种算法来完成此任务。

2018-08-13

基于深度负相关学习的人群计数方法

监控视频中的人群自动计数有着重要的社会意义和市场应用前景。充分利用兴趣区域的人数统计信息可以为一些人群密集的商场、车站、广场等公共场合的安全预警提供有效的指导。还可以带来经济效益,例如,提高服务质量、分析顾客行为、广告投放和优化资源配置等。因此,该问题已成为计算机视觉和智能视频监控领域的重要研究内容。

2018-08-13

人脸检测算法之S3FD

人脸相对于其他物体来说有一个普遍的特点,就是在图像中所占像素少。比如,coco数据集中,有一个分类是“人”,但是人脸在人体中只占很少一部分,在全图像上所占比例就更少了。本文所要介绍的S3FD[1](Single Shot Scale-invariant Face Detector)正是要解决这个问题。

2018-08-13

怎样成为一名优秀的算法工程师

怎样成为一名优秀的算法工程师?为了更好的帮助大家学习和成长,少走弯路,在今天的文章里,SIGAI的作者以自己的亲身经历和思考,为大家写下对这一问题的理解与答案。

2018-08-13

生成式对抗网络模型综述

本文介绍了GAN最初被提出时的基本思想,阐述了其一步步演化、改进的动机和基本思想以及原理,从基于模型改进的角度介绍了WGAN,WGAN-GP,LSGAN,f-GAN,LS-GAN以及GLS-GAN,EBGAN,BEGAN等GAN发展过程中较为重要的改进模型,以及从应用创新角度介绍了CGAN,InfoGAN,Pix2Pix,CycleGAN,StarGAN等较为常用或热门的GAN的应用方法。

2018-08-13

算法地图高清版图片

高清机器学习算法地图。更多原创干货人工智能资源,请搜索关注微信公众号。

2018-07-10

反向传播算法推导—全连接神经网络

反向传播算法是人工神经网络训练时采用的一种通用方法,在现代深度学习中得到了大 规模的应用。全连接神经网络(多层感知器模型,MLP),卷积神经网络(CNN),循环神 经网络(RNN)中都有它的实现版本。算法从多元复合函数求导的链式法则导出,递推的 计算神经网络每一层参数的梯度值。算法名称中的“误差”是指损失函数对神经网络每一层 临时输出值的梯度。反向传播算法从神经网络的输出层开始,利用递推公式根据后一层的误 差计算本层的误差,通过误差计算本层参数的梯度值,然后将差项传播到前一层

2018-07-07

机器学习算法地图

最全面透彻的算法合集,帮你快速构筑算法地图。最全面透彻的算法合集,帮你快速构筑算法地图。

2018-07-07

理解计算——从根号2到AlphGo·第二季

尽管“神经网络”这个词的出现已经有些年头,但是人们并没有对其建立严格的数学符号和形式化的表示,而且神经网络从一开始就不是独立的学科,它来源于生理学,心理学,物理,数学,工程的交叉领域,所以这种交叉使的神经网络的研究看起来有点混乱。特别是现在的“深度学习”,有点急于撇清与神经网络的联系,我将通过对这一段漫长历史的回顾,来看看他们之间无法割舍的血缘关系

2018-07-02

自然场景文本检测识别技术综述

本文介绍图像文本识别(OCR)领域的最新技术进展。首先介绍应用背景,包括面临的技术挑战、典型应用场景、系统实施框架等。接着介绍搭建图文识别模型过程中经常被引用到的多种特征提取基础网络、物体检测网络框架,以及它们被应用到图文识别任务中所面临的场景适配问题。然后介绍最近三年来出现的各种文本边框检测模型、文字内容识别模型、端到端图文识别模型。最后介绍图文识别领域的大型公开数据集。

2018-06-30

人脸算法演化史

人脸识别的目标是确定一张人脸图像的身份,即这个人是谁,这是机器学习和模式识别中的分类问题。它主要应用在身份识别和身份验证中。其中身份识别包括失踪人口和嫌疑人追踪、智能交互场景中识别用户身份等场景;而身份验证包括身份证等证件查询、出入考勤查验、身份验证解锁、支付等场景,应用场景丰富。就在前不久,北京多家医院借助“黑科技”人脸识别技术阻击“熟脸”的号贩子,降低其挂号率;目前人脸识别还用到了治理闯红灯问题,改善中国式过马路现象。

2018-06-26

机器学习——波澜壮阔四十年

机器学习是人工智能的一个分支,也是人工智能的一种实现方法。它从样本数据中学习得到知识和规律,然后用于实际的推断和决策。它和普通程序的一个显著区别是需要样本数据,是一种数据驱动的方法。

2018-06-26

理解神经网络的激活函数

激活函数在神经网络中具有重要的地位,对于常用的函数如sigmoid,tanh,ReLU,不少读者都已经非常熟悉。但是你是否曾想过这几个问题: 为什么需要激活函数? 什么样的函数可以做激活函数? 什么样的函数是好的激活函数? 在这篇文章中,SIGAI将和大家一起讨论这几个问题,以加深对激活函数的理解,如果对本文的观点持有不同的意见,欢迎向我们的公众号发消息一起讨论。

2018-06-26

人脸检测算法综述

人脸检测是目前所有目标检测子方向中被研究的最充分的问题之一,它在安防监控,人证比对,人机交互,社交和娱乐等方面有很强的应用价值,也是整个人脸识别算法的第一步。在本文中,SIGAI将和大家一起回顾人脸检测算法的整个发展历史。

2018-06-26

基于深度学习的目标检测算法综述

目标检测的任务是找出图像中所有感兴趣的目标(物体),确定它们的位置和大小,是机器视觉领域的核心问题之一。由于各类物体有不同的外观,形状,姿态,加上成像时光照,遮挡等因素的干扰,目标检测一直是机器视觉领域最具有挑战性的问题。本文将针对目标检测(Object Detection)这个机器视觉中的经典任务进行解析,抛砖引玉。如对文中的内容持不同观点,欢迎到SIGAI公众号发消息给我们,一起探讨!

2018-06-26

用一张图理解SVM的脉络

在各种机器学习算法中,SVM是对数学要求较高的一种,一直以来不易被初学者掌握。如果能把握住推导的整体思路,则能降低理解的难度,在本文中SIGAI将通过一张图来为大家讲述SVM的整个推导过程。

2018-06-26

卷积神经网络为什么这么有效

在机器视觉和其他很多问题上,卷积神经网络取得了当前最好的效果,它的成功促使我们思考一个问题,卷积神经网络为什么会这么有效?在本文中,SIGAI将为大家分析卷积神经网络背后的奥秘。

2018-06-26

卷积神经网络综述

从1989年LeCun提出第一个真正意义上的卷积神经网络到今天为止,它已经走过了29个年头。自2012年AlexNet网络出现之后,最近6年以来,卷积神经网络得到了急速发展,在很多问题上取得了当前最好的结果,是各种深度学习技术中用途最广泛的一种。在本文中SIGAI将为大家回顾和总结卷积神经网络的整个发展过程。

2018-06-26

理解凸优化

凸优化(convex optimization)是最优化问题中非常重要的一类,也是被研究的很透彻的一类。对于机器学习来说,如果要优化的问题被证明是凸优化问题,则说明此问题可以被比较好的解决。在本文中,SIGAI将为大家深入浅出的介绍凸优化的概念以及在机器学习中的应用。

2018-06-26

理解SVM核函数和参数的作用

支持向量机(SVM)在很多分类问题上曾经取得了当时最好的性能,使用非线性核的支持向量机可以处理线性不可分的问题。仅仅通过一个简单的核函数映射,就能达到如此好的效果,这让我们觉得有些不可思议。核函数过于抽象,在本文中,SIGAI将通过一组实验来演示核函数的有效性,并解释支持向量机各个参数所起到的作用,让大家对此有一个直观的认识。如果要了解SVM的理论,请阅读我们之前的公众号文章“用一张图理解SVM的脉络”

2018-06-26

理解梯度下降法

最优化问题在机器学习中有非常重要的地位,很多机器学习算法最后都归结为求解最优化问题。在各种最优化算法中,梯度下降法是最简单、最常见的一种,在深度学习的训练中被广为使用。在本文中,SIGAI将为大家系统的讲述梯度下降法的原理和实现细节问题。

2018-06-26

机器学习在自动驾驶中的应用-以百度阿波罗平台为例【上】

自动驾驶是人工智能当前最热门的方向之一,也是未来将对人类生活会产生重大影响的方向。机器学习在自动驾驶中有举足轻重的地位,从环境感知到策略控制,都有它的身影。在本文中,SIGAI将以百度阿波罗平台为例,介绍机器学习在自动驾驶系统中的应用,揭开自动驾驶算法的神秘面纱。

2018-06-26

关于深度学习和机器学习一些值得思考的问题

sigai技术交流群成立以来,群友们对很多技术问题进行了热烈的讨论,在这里,我们将精华的话题整理出来,做一个总结。以后在每个月我们都会有类似的总结,敬请期待。

2018-06-26

理解牛顿法

牛顿法是数值优化算法中的大家族,她和她的改进型在很多实际问题中得到了应用。在机器学习中,牛顿法是和梯度下降法地位相当的的主要优化算法。在本文中,SIGAI将为大家深入浅出的系统讲述牛顿法的原理与应用。

2018-06-26

行人检测算法

行人检测是计算机视觉中的经典问题,也是长期以来难以解决的问题。和人脸检测问题相比,由于人体的姿态复杂,变形更大,附着物和遮挡等问题更严重,因此准确的检测处于各种场景下的行人具有很大的难度。在本文中,SIGAI将为大家回顾行人检测算法的发展历程。

2018-06-26

大话Adaboost算法

AdaBoost算法是一种集成学习(ensemble learning)方法。集成学习是机器学习中的一类方法,它对多个机器学习模型进行组合形成一个精度更高的模型,参与组合的模型称为弱学习器(weak learner)。在预测时使用这些弱学习器模型联合起来进行预测;训练时需要用训练样本集依次训练出这些弱学习器。典型的集成学习算法是随机森林和boosting算法,而AdaBoost算法是boosting算法的一种实现版本。

2018-06-26

循环网络综述

循环神经网络是一种具有记忆功能的神经网络,适合序列数据的建模。它在语音识别、自然语言处理等领域取得了成功。是除卷积神经网络之外深度学习中最常用的一种网络结构。在本文中,SIGAI将和大家一起回顾循环神经网络的发展历程与在各个领域的应用。

2018-06-26

理解决策树

决策树是最简单的机器学习算法,它易于实现,可解释性强,完全符合人类的直观思维,有着广泛的应用。决策树到底是什么?简单地讲,决策树是一棵二叉或多叉树(如果你对树的概念都不清楚,请先去学习数据结构课程),它对数据的属性进行判断,得到分类或回归结果。预测时,在树的内部节点处用某一属性值(特征向量的某一分量)进行判断,根据判断结果决定进入哪个分支节点,直到到达叶子节点处,得到分类或回归结果。这是一种基于if-then-else规则的有监督学习算法,决策树的这些规则通过训练得到,而不是人工制定的。

2018-06-26

理解主成分分析法

主成分分析法 (PCA) 是一种常用的数据分析手段。对于一组不同维度 之间可能存在线性相关关系的数据,PCA 能够把这组数据通过正交变换变 成各个维度之间线性无关的数据。经过 PCA 处理的数据中的各个样本之间 的关系往往更直观,所以它是一种非常常用的数据分析和预处理工具。PCA处理之后的数据各个维度之间是线性无关的,通过剔除方差较小的那些维度上的数据我们可以达到数据降维的目的。在本文中,SIGAI将介绍PCA 的原理、应用以及缺陷。

2018-06-26

用一句话总结各种机器学习算法

浓缩就是精华。想要把书写厚很容易,想要写薄却非常难。现在已经有这么多经典的机器学习算法,如果能抓住它们的核心本质,无论是对于理解还是对于记忆都有很大的帮助,还能让你更可能通过面试。在本文中,SIGAI将用一句话来总结每种典型的机器学习算法,帮你抓住问题的本质,强化理解和记忆。下面我们就开始了。

2018-06-26

基于神经网络的光流预测算法

光流问题长久以来,主要被基于变分能量模型的优化算法和基于块匹配的启发式算法统治着。随着深度神经网络技术在计算机视觉领域取得的成功,科学家们开始尝试利用深度学习技术的优势去解决光流问题。

2018-06-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除