自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(47)
  • 收藏
  • 关注

原创 自动模型压缩与架构搜索:飞桨PaddleSlim最全解读

近年来,深度学习技术在很多方向都取得了巨大的成功,但由于深度神经网络计算复杂度高,模型参数量大,限制了其在一些场景和设备上进行部署,特别是在移动嵌入式设备的部署。因此,模型小型化技术成为最近几年学术界和工业界研究的热点,模型小型化技术也从最开始的网络剪枝、知识蒸馏、参数量化等发展为最新的神经网络架构搜索(NAS)和自动模型压缩等技术。飞桨核心框架 Paddle Fluid v1.5 版本,Pa...

2019-12-26 14:59:50 457

原创 如何用飞桨实现 Bengio 经典神经网络语言模型?

刚入门深度学习与自然语言处理(NLP)时,在学习了 Goldberg 特别棒的入门书 NN4NLP,斯坦福 cs224n 等等后,也无限次起念头,写个系列吧,但都不了了之了。近来,NLP 领域因为超大预训练模型,很多研究需要耗费大量计算资源(比如百度新发布持续学习语义理解框架 ERNIE 2.0,该模型在共计 16 个中英文任务上超越了 BERT 和 XLNet,取得了 SOTA 效果),这样...

2019-12-24 12:09:07 197

原创 百度助力数据挖掘世界杯KDD Cup 历史性革新

8月6日,一年一度的KDD(国际数据挖掘与知识发现)大会召开,这是数据挖掘领域国际最高级别会议,而其旗下赛事KDD Cup 被称为数据挖掘领域的“世界杯”。今年,KDD Cup 在赛制上进行了诸多创新,百度公司赞助并出题的常规机器学习竞赛(Regular ML Track)不仅刷新了参赛人数记录,也首次设置开放研究赛题,中国军团也不负众望,斩获大部分重量级奖项。同时,百度也是赛事的钻石赞助商,助推...

2019-12-24 12:07:45 137

原创 NeurIPS颁奖现场揭秘:如何用飞桨PARL控制仿生人运动

相比于一年举办数十场的各种类型的图像识别/分割大赛而言,强化学习的顶级赛事可谓是寥寥可数,其技术报告更是凤毛麟角。强化学习在赛事领域到底有哪些常用的解题思路以及黑科技呢?今天我们通过解读NeurIPS强化学习赛事颁奖现场的技术报告,为大家带来仿生人控制大赛这一国际顶尖赛事的冠军解决方案。训练代码的开源路径:https://github.com/PaddlePaddle/PARL...

2019-12-24 12:05:55 121

原创 稳居第一梯队!百度飞桨年底再交亮眼成绩单

AI 工业大生产已经来临,以深度学习开源框架为核心的深度学习平台成为助攻 AI 规模化落地的利器,是 AI 时代科技巨头们的必争之地。近日,全球权威咨询机构 IDC 发布2019年下半年《深度学习框架和平台市场份额》报告,全面解析了中国深度学习框架和平台市场的现状。报告显示,在中国深度学习平台市场,谷歌、Facebook、百度三强鼎立态势稳固,已占据接近80%的市场份额,其中百度的市场份额...

2019-12-24 12:05:14 128 1

原创 下一幕,边缘! 百度飞桨携手英伟达EGX打造边缘AI技术底座

AI的下一个机遇正在边缘爆发。12月18日,英伟达GTC CHINA 2019这一年度AI盛会于苏州正式开幕,英伟达创始人CEO黄仁勋到场发表演讲,强调了边缘智能新机遇。会议中,百度开源深度学习平台飞桨宣布已适配NVIDIA EGX边缘计算平台,飞桨深度学习推理模型可直接在EGX平台上运行,并提供端云协同解决方案。双方强强联手,为边缘AI落地打造了坚实技术底座。让 AI 在数据产生的地...

2019-12-24 12:04:25 152

原创 信息检索&FAQ硬核技术!飞桨开源百度自研SimNet模型

导读:飞桨PaddlePaddle致力于让深度学习技术的创新与应用更简单。飞桨开源的百度自研SimNet-BOW-Pairwise语义匹配模型,在真实的FAQ问答场景中,比其他基于字面的相似度方法AUC提升了5%以上。在公开语义匹配数据集(LCQMC)进行评测准确率也达到了0.7532,性能超越同等复杂的CBOW基线模型。SimNet 显著改善了长冷 query 的搜索效果,提升了搜索智能化的水平...

2019-12-19 16:14:16 176

原创 用飞桨做命名实体识别,手把手教你实现经典模型 BiGRU + CRF

命名实体识别(Named Entity Recognition,NER)是 NLP 几个经典任务之一,通俗易懂的来说,就是从一段文本中抽取出需求的关键词,如地名,人名等。如上图所示,Google、IBM、Baidu 这些都是企业名、Chinese、U.S. 都是地名。就科学研究来说,命名实体是非常通用的技术,类似任务型对话中的槽位识别(Slot Filling)、基础语言学中的...

2019-12-19 12:24:46 406

原创 Paddle Lite特性全解读,多硬件支持、轻量化部署等亮点频现

本文主要由 9 月 21 日在百度科技园举办的 AI 快车道 Paddle Lite 专场的演讲材料整理而成,分别介绍了 Paddle Lite 的性能特性、使用方法、架构设计等,并且提供了完整的使用案例,可供开发者迅速开展应用。在技术革新的浪潮下,智能硬件结合人工智能越来越广地进入了我们的生活。小到智能手机、手表,大到智能交通系统、工业自动检测平台等,无不渗透了人工智能的威力。此外,为...

2019-12-17 15:25:28 221

原创 一文读懂最强中文NLP预训练模型ERNIE

基于飞桨开源的持续学习的语义理解框架ERNIE 2.0,及基于此框架的ERNIE 2.0预训练模型,在共计16个中英文任务上超越了BERT和XLNet, 取得了SOTA效果。本文带你进一步深入了解ERNIE的技术细节。一:ERNIE 简介1.1 简介Google 最近提出的 BERT 模型,通过随机屏蔽15%的字或者word,利用 Transformer 的多层 self-attent...

2019-12-17 15:24:58 691

原创 Paddle Lite特性全解读,多硬件支持、轻量化部署等亮点频现

本文主要由 9 月 21 日在百度科技园举办的 AI 快车道 Paddle Lite 专场的演讲材料整理而成,分别介绍了 Paddle Lite 的性能特性、使用方法、架构设计等,并且提供了完整的使用案例,可供开发者迅速开展应用。在技术革新的浪潮下,智能硬件结合人工智能越来越广地进入了我们的生活。小到智能手机、手表,大到智能交通系统、工业自动检测平台等,无不渗透了人工智能的威力。此外,为...

2019-12-17 15:24:17 157

原创 飞桨开源Open Images Dataset V5目标检测比赛最好单模型MSF-DET

目标检测是计算机视觉领域中的核心任务。Open Images Dataset V5(OIDV5)是目前规模最大的目标检测公开数据集[1]。基于飞桨(PaddlePaddle)的PaddleDetection目标模型库[2],百度研发了大规模图像目标检测模型MSF-DET (Multi-Strategy Fused Detection framework),是Google举办的Open Imag...

2019-12-14 00:24:38 472

原创 Paddle Lite新增ARM端图像预处理库

Paddle Lite 是飞桨的端侧推理引擎,具有高性能、多硬件、轻量级的特点,它支持飞桨/TensorFlow/Caffe/ONNX等模型在ARM CPU, Mali GPU, Adreno GPU, Huawei NPU 等多种硬件上的推理部署,性能达到业内领先。目前Paddle Lite保持快速的迭代优化升级,距离正式版2.0.0发布仅一个月,Paddle Lite又一次发布了2.1...

2019-12-14 00:24:02 151

原创 GLUE榜单史上首破90大关!百度预训练模型ERNIE荣登榜首

北京时间12月10日,预训练模型界的“MVP”百度ERNIE再展锋芒,在自然语言处理领域权威数据集GLUE中荣登榜首,并以9个任务平均得分首次突破90大关刷新该榜单历史,超越微软MT-DNN-SMART、谷歌T5、ALBERT等一众国际顶级预训练模型的表现,实力得到极大彰显。本次GLUE榜单第一的含金量可谓十足。众所周知,通用语言理解评估基准GLUE是自然语言处理领域最权威的排行...

2019-12-14 00:23:21 109

原创 PaddlePaddle-GitHub的正确打开姿势

GitHub是一个面向开源及私有软件项目的托管平台、也是项目版本管理工具,会使用它是程序员入门的必备技能。PaddlePaddle也不例外,所有的源码及项目进展都在GitHub上开源公布。但对于刚入门写程序的同学来说,一打开GitHub看起来云里雾里,会有种无从下手的感觉,本文给同学介绍PaddlePaddle在GitHub仓库上的快速上手指南。PaddlePaddle项目介绍登录G...

2019-12-12 15:34:40 165

原创 期盼数月的召唤|PaddlePaddle中文文档利剑来袭

发布三年之后,百度深度学习框架PaddlePaddle有了官方中文版文档。今年11月份,PaddlePaddle的用户们在中文社区论坛以及社群上发出召唤:PaddlePaddle官方是否能搞个PaddlePaddle文档的中文版?这个呼声在PaddlePaddle团队内引起广泛关注,研发团队马上在 GitHub 上展开了一个 PaddlePaddle中文文档项目。两个多月后,官方中文文档终...

2019-12-12 15:33:35 88

原创 首个完整支持中文文档的深度学习框架——百度PaddlePaddle API文档简介

导语PaddlePaddle 作为国内首个深度学习开源平台,在 Fluid v1.0版本提供了稳定且向后兼容的 API及英文说明文档。经过不断的优化与迭代,如今已推出了最新的版本Fluid v1.2。1.2版本中除了在基础框架、预测引擎、模型建设、分布式训练各个方向完成了多项更新,还增加API中文文档,使PaddlePaddle API有了完备的中英双语使用指南。(http:...

2019-12-12 15:32:58 162

原创 神经网络机器翻译技术及应用(上)

何中军,百度机器翻译技术负责人。本文根据作者2018年12月在全球架构师峰会上的特邀报告整理而成。本报告分为以下5个部分: 机器翻译基本原理,介绍机器翻译原理、主要挑战、发展历程,及评价方法 神经网络机器翻译,介绍近年来迅速崛起的神经网络机器翻译 技术挑战,尽管神经网络机器翻译取得一系列较大的进展,但是仍然面临诸多挑战; 典型应用,机器翻译在生产、...

2019-12-11 09:15:53 4098

原创 基于PaddlePaddle的词向量实战 | 深度学习基础任务教程系列(二)

词向量是自然语言处理中常见的一个操作,是搜索引擎、广告系统、推荐系统等互联网服务背后常见的基础技术。在这些互联网服务里,我们经常要比较两个词或者两段文本之间的相关性。为了做这样的比较,我们往往把词表示成计算机适合处理的方式。最自然的方式莫过于向量空间模型(vector space model)。在这种方式里,每个词被表示成一个实数向量(one-hot vector),其长度为字典大小,每...

2019-12-11 09:10:53 214

原创 基于PaddlePaddle的图像分类实战 | 深度学习基础任务教程系列(一)

图像相比文字能够提供更加生动、容易理解及更具艺术感的信息,图像分类是根据图像的语义信息将不同类别图像区分开来,是图像检测、图像分割、物体跟踪、行为分析等其他高层视觉任务的基础。图像分类在安防、交通、互联网、医学等领域有着广泛的应用。一般来说,图像分类通过手工提取特征或特征学习方法对整个图像进行全部描述,然后使用分类器判别物体类别,因此如何提取图像的特征至关重要。基于深度学习的图像分类方...

2019-12-11 09:10:02 1000

原创 如何用Paddle Fluid API搭建一个简单的神经网络?

本文将介绍: Paddle Fluid 有哪些核心概念 如何在 Paddle Fluid 中定义运算过程 如何使用 executor 运行 Paddle Fluid 操作 如何从逻辑层对实际问题建模 如何调用 API(层,数据集,损失函数,优化方法等等) 使用 Tensor 表示数据Paddle Fluid 和其它主流框架一样,使用 Tenso...

2019-12-11 09:09:29 179

原创 一文看懂人机对话

一、人机对话概述人机对话(Human-Machine Conversation)是指让机器理解和运用自然语言实现人机通信的技术,如图1所示。通过人机对话交互,用户可以查询信息,如示例中的第一轮对话,用户查询天气信息;用户也可以和机器进行聊天,如示例中的第二轮对话;用户还可以获取特定服务,如示例中的最后两轮对话,用户获取电影票预定服务。图1 人机对话示例人机对话是人工智能的重要...

2019-12-11 09:08:56 544

原创 神经网络机器翻译技术及应用(下)

何中军,百度机器翻译技术负责人。本文根据作者2018年12月在全球架构师峰会上的特邀报告整理而成。神经网络机器翻译技术及应用(上)篇,我们为大家介绍了神经网络机器翻译的基本原理和挑战,(下)篇继续为大家讲述机器翻译的应用与未来。前面我们讲了机器翻译的原理以及神经网络翻译的发展、以及面临的挑战,我们现在看一看,机器翻译现在有哪些应用?机器翻译在越来越多地帮助和影响我们的生活...

2019-12-11 09:08:27 244

原创 神经网络机器翻译技术及应用(上)

何中军,百度机器翻译技术负责人。本文根据作者2018年12月在全球架构师峰会上的特邀报告整理而成。本报告分为以下5个部分: 机器翻译基本原理,介绍机器翻译原理、主要挑战、发展历程,及评价方法 神经网络机器翻译,介绍近年来迅速崛起的神经网络机器翻译 技术挑战,尽管神经网络机器翻译取得一系列较大的进展,但是仍然面临诸多挑战; 典型应用,机器翻译在生产、...

2019-12-11 09:07:56 2456

原创 基于SSD的目标检测模型

简介Single Shot MultiBox Detector (SSD)是一种单阶段的目标检测器。与两阶段的检测方法不同,单阶段目标检测并不进行区域推荐,而是直接从特征图回归出目标的边界框和分类概率。SSD 运用了这种单阶段检测的思想,并且对其进行改进:在不同尺度的特征图上检测对应尺度的目标。如下图所示,SSD 在六个尺度的特征图上进行了不同层级的预测。每个层级由两个3x3卷积分别对目标类...

2019-12-11 08:48:24 390

原创 图片分类及Paddle派部署实例

项目简介这是一个demo 项目,用于演示如何在 AI Studio 上训练一个“小”模型,然后把它转化成一个可以部署到Paddle派硬件上的模型。为了简单起见,在此只训练一个猫猫和狗狗的二分类模型。进入项目时,已经引用了 AI Studio 的公开数据集"猫狗大战数据集"作为训练数据。数据存储在 data/data62/ 目录下,以压缩包的形式存在。执行下面的代码,进入目录,将训练数据...

2019-12-11 08:47:52 149

原创 用PaddlePaddle鉴定红酒质量

PaddlePaddle实现多层神经网络欢迎大家来到这次实验,在这次实验中我们将使用PaddlePaddle来实现一个多层神经网络,这个多层神经网络包含2个隐藏层,并且在隐藏层中使用到了Relu激活函数,在最后的输出层使用了Softmax激活函数。多层神经网络具有比逻辑回归更强的学习能力,并且更适合解决多分类问题,现在让我们进入实验来看看多层神经网络与逻辑回归之间的差异性吧!你将学会...

2019-12-11 08:47:15 139

原创 【进阶实战】使用PaddlePaddle测试土壤有机质预测含氮量

PaddlePaddle实现线性回归在本次实验中我们将使用PaddlePaddle来搭建一个简单的线性回归模型,并利用这一模型实现已知某地给定有机质含量对土壤的含氮量进行预测。并且在学习模型搭建的过程中,了解到机器学习的若干重要概念,掌握一个机器学习预测的基本流程。** 线性回归的基本概念 **线性回归是机器学习中最简单也是最重要的模型之一,其模型建立遵循此流程:获取数据、数据预处理、...

2019-12-05 15:13:24 191

原创 【进阶实战】用PaddlePaddle实现LSTM股票预测

Paddlepaddle实现LSTM - 股票预测欢迎大家来到这个实验,本实验实现的是利用LSTM (长短期记忆神经网络) 进行股票预测,通过本次实验,你将了解股票预测的方法、股票预测的数据集处理技巧、LSTM模型搭建以及训练过程等等,除此之外,你还将看到Paddlepaddle框架实现深度学习的一个十分清晰的结构流程,加深你对Paddlepaddle的了解。在开始实验之前,我们有必要先来...

2019-12-05 15:12:50 1477

原创 【新手入门】课程10-深度学习进阶NLP-机器翻译

任务介绍机器翻译:即用计算机实现从源语言到目标语言转换的过程,是自然语言处理的重要研究领域之一。源语言:被翻译的语言目标语言:翻译后的结果语言数据集介绍数据集:WMT-14数据集该数据集有193319条训练数据,6003条测试数据,词典长度为30000。Paddle接口paddle.dataset.wmt14中默认提供了一个经过预处理的较小规模的数据集。数据预处...

2019-12-05 15:12:12 225

原创 【新手入门】课程9-深度学习进阶CV-目标检测

In[1]# 查看当前挂载的数据集目录!cd /home/aistudio/data/data4379 && unzip -o pascalvoc.zip && rm *.jpgIn[2]!mkdir pretrained-model!mkdir ssd-modelIn[3]!cp data/data7948/mobilenet_v1...

2019-12-04 15:44:25 517

原创 【新手入门】课程8-循环神经网络NLP-情感分类

任务介绍:在自然语言处理中,情感分析一般指判断一段文本所表达的情绪状态,属于文本分类问题。情绪:正面/负面数据集介绍:IMDB数据集包含来自互联网的50000条严重两极分化的评论,该数据被分为用于训练的25000条评论和用于测试的25000条评论,训练集和测试集都包含50%的正面评价和50%的负面评价。该数据集已经经过预处理:评论(单词序列)已经被转换为整数序列,其中每...

2019-12-04 15:43:52 167

原创 【新手入门】课程7-卷积神经网络-人脸识别初探

下面是代码的整个结构目录: 【1.用来存放自定义图片的目录——/home/aistudio/data/data2394/images/face】 【2.用来存放图像列表的目录——/home/aistudio/data/data2394/face/】 【3.model_vgg用来存放vgg网络训练的模型】 【4.model_cnn用来存放cnn网路训练的模型】用%pwd查看当前所在目录In...

2019-12-04 15:43:20 237

原创 提速1000倍,预测延迟少于1ms,百度飞桨发布基于ERNIE的语义理解开发套件

在「WAVE Summit+」2019 深度学习开发者秋季峰会上,百度对外发布基于 ERNIE 的语义理解开发套件,旨在为企业级开发者提供更领先、高效、易用的 ERNIE 应用服务,全面释放 ERNIE 的工业化价值,其中包含 ERNIE 轻量级解决方案,提速 1000 倍!今年 7 月份,百度发布持续学习语义理解框架 ERNIE 2.0,在共计 16 个中英文任务上超越 BE...

2019-12-03 18:14:52 126

原创 Paddle Lite 2.0 正式发布:更强大易用的端侧推理引擎

今年8月,飞桨(PaddlePaddle)对外发布面向终端和边缘设备的端侧推理引擎Paddle Lite Beta版。经过近两个多月的迭代和发展,“WAVE Summit+ ”2019深度学习开发者峰会上Paddle Lite 2.0 正式版发布。Paddle Lite的Github链接:https://github.com/PaddlePaddle/Paddle-Lite...

2019-12-03 18:14:07 556

原创 飞桨全新发布,核心框架首次完整公开解读

11月5日,在Wave Summit+2019深度学习开发者峰会上,飞桨全新发布和重要升级了最新的21项进展,在深度学习开发者社区引起了巨大的反响。很多未到场的开发者觉得遗憾,希望可以了解飞桨发布会背后的更多技术细节。因此本号特意策划了一系列稿件,分别从核心框架、基础模型库、端到端开发套件、工具组件和服务平台五个层面分别详细解读飞桨的核心技术与最新进展。今天给大家带来的是飞...

2019-12-03 18:09:06 230

原创 【新手入门】课程6-卷积神经网络实践-猫狗分类

图像分类是根据图像的语义信息将不同类别图像区分开来,是计算机视觉中重要的基本问题猫狗分类属于图像分类中的粗粒度分类问题实践总体过程和步骤如下图首先导入必要的包paddle.fluid--->PaddlePaddle深度学习框架os------------->python的模块,可使用该模块对操作系统进行操作In[1]#导入需要的包import p...

2019-11-29 15:21:51 1192

原创 【新手入门】课程5-深度学习入门NLP-文本分类

In[1]# 创建数据集和数据字典data_root_path='/home/aistudio/data/'def create_data_list(data_root_path): with open(data_root_path + 'test_list.txt', 'w') as f: pass with open(data_root_path ...

2019-11-29 15:21:01 197

原创 【新手入门】课程4-深度学习入门CV-手写数字识别

本实践使用多层感知器训练(DNN)模型,用于预测手写数字图片。实践总体过程和步骤如下图首先导入必要的包numpy---------->python第三方库,用于进行科学计算PIL------------> Python Image Library,python第三方图像处理库matplotlib----->python的绘图库 pyplot:matpl...

2019-11-29 15:20:32 310

原创 【新手入门】课程3-Paddle入门-波士顿房价预测

经典的线性回归模型主要用来预测一些存在着线性关系的数据集。回归模型可以理解为:存在一个点集,用一条曲线去拟合它分布的过程。如果拟合曲线是一条直线,则称为线性回归。如果是一条二次曲线,则被称为二次回归。线性回归是回归模型中最简单的一种。 本教程使用PaddlePaddle建立起一个房价预测模型。在线性回归中:(1)假设函数是指,用数学的方法描述自变量和因变量之间的关系,它们之间可以是一个线...

2019-11-28 17:11:43 255

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除