自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(237)
  • 收藏
  • 关注

原创 Google AI 教育项目今起免费开放,支持中文

今天,谷歌上线人工智能学习网站Learn with Google AI,网站设有一门名为机器学习速成班(Machine Learning Crash Course ,MLCC)的免费课程。该课程基于谷歌内部课程,最初旨在帮助谷歌员工对AI和机器学习基础知识进行介绍。MLCC有中文版网站!网址是:https://developers.google.com/machine-learning/crash...

2018-03-01 16:17:19 4022

转载 姿态估计相比Mask-RCNN提高8.2%,上海交大卢策吾团队开源AlphaPose

由上海交通大学卢策吾团队发布的开源系统AlphaPose近日上线,该开源系统在标准测试集COCO上较现有最好姿态估计开源系统Mask-RCNN相对提高8.2%。Mask-RCNN是2017年以来计算机视觉领域的一个突破,获得了ICCV 2017最佳论文(马尔奖),涵盖了物体检测,分割,姿态估计。该系统比较的是其姿态估计部分。该系统是基于卢策吾团队ICCV 2017发表的RMPE算法[1]开发。以下

2018-02-05 14:29:24 6525

原创 Hinton胶囊网络论文《Dynamic Routing between Capsules》的代码正式开源

github地址:https://github.com/Sarasra/models/tree/master/research/capsules运行测试验证设置是否正确,例如:python layers_test.py快速MNIST测试结果:从以下网址下载并提取MNIST记录到 $DATA_DIR/:https://storage.goo

2018-02-01 16:07:37 3381 1

转载 图像分类、检测,语义分割等方法梳理

作者:张皓【新智元导读】本文作者来自南京大学计算机系机器学习与数据挖掘所(LAMDA),本文直观系统地梳理了深度学习在计算机视觉领域四大基本任务中的应用,包括图像分类、定位、检测、语义分割和实例分割。本文旨在介绍深度学习在计算机视觉领域四大基本任务中的应用,包括分类(图a)、定位、检测(图b)、语义分割(图c)、和实例分割(图d)。图像分类(image classi

2018-01-24 15:06:30 4643

转载 谷歌最新AI产品——AutoML Vision,可以自动设计机器学习模型

今天凌晨时分,李飞飞通过一篇博客文章发布了谷歌最新AI产品——AutoML Vision,可以自动设计机器学习模型。我很荣幸地宣布AutoML Vision面世。无需精通机器学习,每个人都能用这款AI产品定制机器学习模型。这是“AI民主化”的重要进展!——李飞飞这个名为Cloud AutoML的宏大项目浮出水面,或标志谷歌发展的战略转型。一直以来面向机器学习人工智能开发者的Google Cloud

2018-01-18 09:03:19 4896

原创 吴恩达【深度学习工程师】学习笔记(十一)

吴恩达【深度学习工程师】专项课程包含以下五门课程:1、神经网络和深度学习;2、改善深层神经网络:超参数调试、正则化以及优化;3、结构化机器学习项目;4、卷积神经网络;5、序列模型。今天介绍《卷积神经网络》系列第一讲:卷积神经网络主要内容:1、计算机视觉2、边缘检测3、padding4、卷积步长5、cnn示例计算

2018-01-17 17:20:21 1380

转载 如何高效进行大规模分类?

大规模分类技术对人脸识别等任务的实际应用有着切实的价值。香港中文大学和商汤科技近日公布的一篇 AAAI 2018 论文介绍了一种旨在高效解决大规模分类问题的方法。机器之心对该研究成果进行了编译介绍。近些年来,在深度学习的发展和数据集的爆发式增长的推动下,人工智能领域已经见证了一波突破浪潮(Shakirov 2016)。伴随着这一趋势,涉及极大数量类别的大规模分类变成了一项重

2018-01-11 15:04:22 2262

原创 山世光:计算机视觉技术现状展望和产业化

深度学习在计算机视觉领域,解决了或者推动了一大类非线性的映射函数学习的问题。但从落地角度来看,依赖于有标注大数据的深度学习也还存在非常多问题。

2018-01-03 14:40:51 1970

转载 致研究者:2018 AI 研究趋势

Alex Honchar在Medium发文,从研究者的角度分享机器学习明年发展的走向。

2018-01-02 10:57:35 1080

转载 CTPN - 自然场景文本检测

文本检测,先用CNN得到深度特征,然后用固定宽度的anchor来检测text proposal(文本线的一部分),并把同一行anchor对应的特征串成序列,输入到RNN中,最后用全连接层来分类或回归,并将正确的text proposal进行合并成文本线。

2017-12-22 14:57:55 34176

转载 如何用深度学习处理结构化数据?

将神经网络用于结构化数据任务

2017-12-21 11:00:36 15506

原创 吴恩达【深度学习工程师】学习笔记(十)

1、进行错误分析; 2、、快速构建系统并迭代; 3、在不同的数据分布上训练和测试; 4、迁移学习; 5、多任务学习; 6、end-to-end学习

2017-12-19 15:01:32 1035

原创 谷歌开源TFGAN:轻量级生成对抗网络工具库

谷歌最近开源了 TFGAN,一个实现轻松训练和评估 GAN 的轻量级库。

2017-12-13 14:42:59 2531

转载 李飞飞在谷歌开发者大会宣布谷歌AI中国中心正式成立

在今天上海开幕的谷歌开发者大会上,谷歌云人工智能与机器学习首席科学家李飞飞宣布谷歌 AI 中国中心正式成立,该中心由李飞飞和 Google Cloud 研发负责人李佳博士共同领导。

2017-12-13 14:17:26 712

转载 R-FCN每秒30帧实时检测3000类物体,马里兰大学Larry Davis组最新目标检测工作

R-FCN-3000在ImageNet检测数据集上获得34.9%的mAP,在每秒处理30帧图像的同时,可以以18%的优势超过YOLO-9000。

2017-12-12 09:28:30 3762

转载 Kaggle网站流量预测任务第一名解决方案:从模型到代码详解时序预测

近日,Artur Suilin 等人发布了 Kaggle 网站流量时序预测竞赛第一名的详细解决方案。他们不仅公开了所有的实现代码,同时还详细解释了实现的模型与经验。

2017-12-07 11:18:20 2537

转载 AlphaZero炼成最强通用棋类AI,DeepMind强化学习算法8小时完爆人类棋类游戏

由于是通用棋类AI,因此去掉了代表围棋的英文“Go”,没有使用人类知识,从零开始训练,所以用Zero,两相结合得到“AlphaZero”,

2017-12-07 10:42:18 4607

原创 吴恩达【深度学习工程师】学习笔记(九)

1、使用ML策略; 2、评估指标; 3、Train/Dev/Test数据集; 4、改变评价标准; 5、人类水平表现

2017-12-05 16:57:35 903

转载 Hinton提出泛化更优的「软决策树」:可解释DNN具体决策

Geoffrey Hinton 等人发表 arXiv 论文提出「软决策树」(Soft Decision Tree)。并且通过层级决策模型把 DNN 所习得的知识表达出来,具体决策解释容易很多。这最终缓解了泛化能力与可解释性之间的张力。

2017-11-29 17:17:08 3640

转载 【计算机视觉这一年】万字长文盘点近百篇代表论文、应用和市场

The M Tank发布了一份对计算机视觉领域最近一年进展的报告《A Year in Computer Vision》

2017-11-27 10:34:25 4370

转载 R-FCN: Object Detection via Region-based Fully Convolutional Networks

R-FCN是在Faster R-CNN的框架上进行改造,第一,把base的VGG16换车了ResNet,第二,把Fast R-CNN换成了先用卷积做prediction,再进行ROI pooling。

2017-11-24 15:10:12 598

转载 旷视&清华大学提出新型两步检测器Light-Head R-CNN

近日,来自旷视和清华的研究者提出一种新型两步检测器 Light-Head R-CNN,改变两步检测器头重脚轻(heavy-head)的设计,实现速度和准确率的双重突破。

2017-11-24 13:58:02 4843 1

转载 Titan XP值不值?一文教你如何挑选深度学习GPU

1、为什么深度学习需要使用 GPU ? 2、GPU 的哪种性能指标最为重要 ? 3、选购 GPU 时有哪些坑需要避免 ?

2017-11-23 14:09:56 3448

原创 吴恩达【深度学习工程师】学习笔记(八)

1、超参数; 2、正则化网络; 3、Softmax回归; 4、程序框架Tensorflow。

2017-11-22 14:44:54 5815

转载 Momenta详解ImageNet 2017夺冠架构SENet

通道间的特征加权组合

2017-11-22 09:47:11 1243

转载 卷积神经网络中10大拍案叫绝的操作

摘要: CNN从2012年的AlexNet发展至今,科学家们发明出各种各样的CNN模型,一个比一个深,一个比一个准确,一个比一个轻量。本文作者对近几年一些具有变革性的工作进行了简单盘点,从这些充满革新性的工作中探讨日后的CNN变革方向。CNN从2012年的AlexNet发展至今,科学家们发明出各种各样的CNN模型,一个比一个深,一个比一个准确,一个比一个轻量。我下面会对近几年一些具有变革性的工作进...

2017-11-21 16:20:58 8659 2

翻译 谷歌移动端深度学习框架TensorFlow Lite正式发布

谷歌移动端深度学习框架TensorFlow Lite正式发布,同时支持android和 iOS

2017-11-15 11:26:39 842

原创 吴恩达【深度学习工程师】学习笔记(七)

1、Mini-batch梯度下降法; 2、指数加权平均; 3、momentum、RMSProp、Adam优化算法; 4、学习率衰减.

2017-11-13 15:02:09 5540

原创 密集人群计数的开源代码github地址

密集人群计数的开源代码github地址

2017-11-10 13:56:23 8032 1

转载 忽悠神经网络指南:教你如何把深度学习模型骗得七荤八素

即使是最先进的深层神经网络也是很容易被欺骗的。只需要使用一些小技巧,你就可以迫使模型预测出你想要的任何结果

2017-11-06 11:16:45 1585

原创 吴恩达【深度学习工程师】学习笔记(六)

1、训练/开发/测试集; 2、偏差/方差; 3、常用的几种正则化方法; 4、梯度消失和梯度爆炸.

2017-11-03 10:44:55 5167 4

转载 Attention Model

本文以机器翻译为例,深入浅出地介绍了深度学习中注意力机制的原理及关键计算机制,同时也抽象出其本质思想,并介绍了注意力模型在图像及语音等领域的典型应用场景。

2017-11-02 15:06:57 2101

转载 将tensorflow训练好的模型移植到android

将tensorflow训练好的模型移植到android

2017-11-02 10:16:10 981

转载 TensorFlow引入了动态图机制Eager Execution

今天,我们为 TensorFlow 引入了「Eager Execution」,它是一个命令式、由运行定义的接口,一旦从 Python 被调用,其操作立即被执行。这使得入门 TensorFlow 变的更简单,也使研发更直观。

2017-11-01 16:20:44 4081

转载 一文读懂Hinton最新Capsules论文

作者尝试用浅显的语言,把论文《Dynamic Routing Between Capsules》梳理一下,有助于理解。

2017-10-29 08:18:16 8348

原创 Mask R-CNN的完整MXNet复现

国内自动驾驶创业公司 图森未来 对最佳论文《Mask R-CNN》的完整复现,并将其开源到了Github 上。

2017-10-27 10:22:12 4474

转载 一文读懂AlphaGo Zero算法

CMU计算机学院暨机器人研究所博士邓侃在本文中,尝试用大白话,通俗地解释 AlphaGo Zero,弄清楚蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)、深度学习启发函数和置信上限这三大核心概念。

2017-10-26 09:23:55 39005

翻译 Focal Loss for Dense Object Detection

针对类别不均衡问题,作者提出一种新的损失函数:focal loss,这个损失函数是在标准交叉熵损失基础上修改得到的。这个函数可以通过减少易分类样本的权重,使得模型在训练时更专注于难分类的样本。

2017-10-25 10:56:47 825

原创 Mask R-CNN

Mask R-CNN 用于目标实例分割的框架,能够有效地检测图像中的目标,同时还能为每个实例生成一个高质量的分割掩码。

2017-10-25 10:28:42 668

翻译 自门控激活函数Swish

Swish 是一种新型激活函数,公式为: f(x) = x · sigmoid(x)。Swish 具备无上界有下界、平滑、非单调的特性。

2017-10-24 09:03:31 5272

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除