智能猫窝是如何诞生的?详解百度大脑的开放生态

540 篇文章 14 订阅

3 月 20 日下午,首场百度大脑开放日在北京中关村创业大街百度大脑创新体验中心举行。百度 AI 技术生态部总经理喻友平,就百度大脑平台与生态进行了全面的详解,同时展示了百度大脑开放平台 Q1 核心升级内容,包括语音技术、视觉技术、自然语言处理、知识图谱等通用 AI 能力,以及开源深度学习框架方面的优化升级和多个应用场景案例分享。

此外,百度大脑工程师晚兮还详解了近期热点案例 “智能猫窝” 的研发。据悉,这款智能猫窝的 AI 模型正是利用百度 2017 年 11 月推出的定制化训练和服务平台 EasyDL 所打造,再结合百度大脑动物识别技术,已实现“猫脸门禁”、“病猫识别”、“绝育识别”三大智能功能。

实际上,这样一款智能猫窝想法从诞生到快速搭建再到付诸使用,背后离不开百度大脑开放生态的持续加持。

人工智能的现状及今后发展趋势如何? https://edu.csdn.net/topic/ai30?utm_source=ai100_bw

能力持续开放

作为百度在人工智能领域多年研究成果的集大成者,百度大脑正在飞速进步着。自 2016 年启动开放以来,百度大脑目前已经是服务规模最大的 AI 开放平台,开放了 158 项 AI 能力,24 小时快速集成,开发者数量超过 100 万,面向广泛的企业和开发者提供最先进、最全面的 AI 能力,不断降低 AI 应用落地的门槛。

百度 AI 技术生态部总经理喻友平谈到,“在百度大脑的开放生态中,开发者一直是最为重要的一环。百度大脑开放能力不断加速,有很多有价值的技术难以被开发者了解。2019 年百度大脑开放日全新登场,希望为 AI 开发者提供及时、全面、近距离地了解百度大脑最新 AI 产品和案例,且能深度、持续交流的平台。”

在这里插入图片描述

(百度 AI 技术生态部总经理喻友平)

首期开放日,喻友平介绍了百度大脑开源深度学习平台 PaddlePaddle 以及通用 AI 能力两方面的技术和产品更新,以及百度大脑在市政、物流、教育等行业的落地案例。

更广、更快、更精的百度 AI

深度学习是 AI 发展的燃料。2016 年,百度开源了深度学习框架 PaddlePaddle。此次,PaddlePaddle 迎来两方面重大更新,核心框架 Paddle Fluid v1.3 新增发布业界首个视频分类模型库,新增支持 NLP 语义表示 BERT 模型,分布式训练性能大幅提升,大规模稀疏参数服务器 Benchmark 发布;同时,基于 PaddlePaddle 的深度强化学习框架 PARL 具有高灵活性和可扩展性,支持可定制的并行扩展,覆盖 DQN、DDPG、PPO、A3C 等主流强化学习算法。

目前,百度 PaddlePaddle 已对外开放超过 50 种经过工业场景验证的官方模型。例如,领邦利用 PaddlePaddle,通过 ICNet 语义分割模型识别精密零件瑕疵,实现零件自动分拣。

在深度学习基础之上,百度大脑通用 AI 能力开放涵盖语音、视觉、自然语言处理、知识图谱等全面 AI 技术。

语音方面推出了语音识别极速版,首次对外开放搭载国际领先的注意力(attention)模型的语音能力,拥有更快的响应速度,相对识别准确度提升 15%。此外,语音识别预置语义解析全新升级,预置场景由 35 个升级为 51 个,从影视娱乐到外卖打车,语义解析效果全面提升。另外,还预告了即将推出的几款新产品,包括语音识别自训练平台、远场语音开发套件和语音离线合成等产品。

视觉方向上,OCR、车辆分析、人脸人体、图像识别都有重磅升级。比如卡证 OCR 新增了户口本、出生医学证明、港澳通行证和台湾通行证四类新能力,可识别卡证总数达到 9 种。只需对着户口本拍一张照片,系统就能字段进行结构化识别,然后反馈出信息页的出生地、出生日期、姓名、民族、与户主关系、性别、身份证号码。而票据 OCR 和汽车场景 OCR 也分别新增了行程单、保单、通用机打发票、定额发票、车辆 VIN 码、机动车销售发票、车辆合格证等识别能力。目前,百度大脑 OCR 产品全系列可以识别类型多达 34 款,实现卡证、票据、文档、汽车全场景覆盖。

人脸人体识别方向,百度大脑发布了新能力——人脸情绪识别,同时升级了人脸关键点检测和手势识别,人脸检测关键点由 72 个增至 150 个,常见手势能识别种数也达到了 24 种。

图像识别方向,百度大脑更新了红酒和地标识别两个新能力。无论是卢浮宫还是 82 年的拉菲,只要上传 1 张照片,就能获得文字解析。车辆分析方面上线了车辆检测和车流统计。喻友平透露,不久后,百度大脑还会陆续上线车辆属性识别、车辆外观损伤识别、人脸融合、手部关键点识别、更高精度的人像分割以及钱币识别等有趣有用的应用场景。

图片: https://uploader.shimo.im/f/9siT8qqeS8weNcrH

同时,百度大脑语言及知识技术也进一步开放。在语言处理应用技术方面,百度大脑新增文本纠错、新闻摘要、智能写诗、智能春联和对话情绪识别等能力,在知识理解方面,百度大脑推出了作文检索和知识问答两个新能力,让学习和娱乐两不误,分分钟化身“十万个都知道”。同时,智能写作平台将在 4 月全面上线,从素材上为创作者提供工具、帮助找到灵感,提升创作者的写作效率和产出质量,降低写作成本。

在 AI 技术支持下,百度大脑也在重点发力智能硬件和设备。1 月 16 日,百度大脑 AI 硬件平台及产品发布会上,发布了 13 项端侧新品。活动现场,喻友平介绍到,目前已有 4 款新品正式上架 AI 市场。

在这里插入图片描述

在 AI 能力广度、速度、精度不断提升的基础下,百度大脑充分利用自己在 AI 领域内的成功经验不断雕琢着自身的核心技术,开始在产业界呈现 “乘法效应” 展现出产业智能化 “头雁” 的速度。

AI 落地的乘法效应

AI 技术的发展,最终还是要落实到我们的生活中。在我们触手可及的各个角落中都有百度大脑加持的智能产品。本次着重介绍了市政、物流、教育三个领域的落地案例。

在这里插入图片描述
比如百度 EasyDL 与分形科技打造的智能垃圾桶已成功地落地海淀公园,可以对 7 种常见垃圾自动分类,后期还可以通过增加训练数据识别更多种类。

在和德邦物流的合作中,为用户免去了自行填写信息的麻烦,使用定制词法分析快递申请,一秒拆分姓名、电话、住址等信息。

更具科研意义的还有百度 EasyDL 与中科院在珍稀鸟类识别项目上展开的合作。在传统分类学日渐没落的今天,百度 EasyDL 可以利用图像识别技术协助专家们对动植物标本、照片进行快速鉴定。目前中科院使用 EasyDL 训练对超过 12 万幅图片进行分析,在 700 多种鸟类模 top5 上的识别准确率达到 93.89%,非雀形目鸟类模型 top5 准确率达到 95.79%,满足上线服务要求。

与卓繁信息的合作,百度大脑还打造了 “AI 便民” 的新型无人值守受理站。通过 UNIT、OCR、人脸识别等 AI 技术,“无人值守”的政务服务新模式为社会公众提供全年无休的 24 小时自助办事服务,提升了政府为民服务的能力。

2018 年,百度大脑走进 6 大城市举办 7 场行业创新论坛,发布了企业服务、信息服务、地产物业、智能零售、智能工厂、智能校园、智能政务 7 大行业解决方案,推动 AI 与不同行业、具体场景相结合,AI 技术渗透到产业的毛细血管。百度大脑目前已经落地 20 + 行业,生态赋能已成燎原之势。

如果只是技术 “阅兵” 会让你觉得意犹未尽,为进一步激励开发者学习应用百度大脑开源能力,百度大脑提出了“百度大脑新品体验师计划”,希望与开发者一起推动百度大脑进化,帮助他人一起成长,探索 AI 前沿应用。

技术更新、新品上线、开发者现身说法、行业案例详细解读、交流互动社区、培养激励措施… 2019 年,百度大脑正以更新、更全面的能力持续赋能开发者。 “人工智能应用的领域可以说无处不在,只要企业、开发者、合作伙伴们能有发现问题的眼睛,就有创新创业的机会。百度大脑把平台和 AI 能力开放出来,希望帮助大家快速地实现各自领域的业务解决方案,创造全新商业模式,带来更多机遇。”喻友平在现场如是说。

60s测试:你是否适合转型人工智能? https://edu.csdn.net/topic/ai30?utm_source=csdn_bw

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值