![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
百度AI
百度AI
才能我浪费
这个作者很懒,什么都没留下…
展开
-
PaddlePaddle : AI抠图及图片合成
通过预训练模型进行图像的自动抠图及整合。代码已经共享在AIStudio上,链接:https://aistudio.baidu.com/aistudio/projectdetail/242887模型概述 DeepLabv3+ 是Google DeepLab语义分割系列网络的最新作,其前作有 DeepLabv1,DeepLabv2, DeepLabv3。在最新作中,作者通过encoder-...原创 2020-01-10 06:55:04 · 4208 阅读 · 1 评论 -
百度AI攻略:Paddlehub实现人体解析
PaddleHub可以便捷地获取PaddlePaddle生态下的预训练模型,完成模型的管理和一键预测。配合使用Fine-tune API,可以基于大规模预训练模型快速完成迁移学习,让预训练模型能更好地服务于用户特定场景的应用。模型概述人体解析(Human Parsing)是细粒度的语义分割任务,其旨在识别像素级别的人类图像的组成部分(例如,身体部位和服装)。ACE2P通过融合底层特征,全局...原创 2020-01-09 08:56:47 · 1299 阅读 · 4 评论 -
百度AI攻略:Paddlehub实现目标检测
PaddleHub可以便捷地获取PaddlePaddle生态下的预训练模型,完成模型的管理和一键预测。配合使用Fine-tune API,可以基于大规模预训练模型快速完成迁移学习,让预训练模型能更好地服务于用户特定场景的应用。模型概述:模型概述Faster_RCNN是两阶段目标检测器。通过对图像生成候选区域,提取特征,判别特征类别并修正候选框位置。Faster_RCNN整体网络可以分为4...原创 2020-01-08 08:50:19 · 1682 阅读 · 1 评论 -
百度AI攻略:Paddlehub实现图像分割
PaddleHub可以便捷地获取PaddlePaddle生态下的预训练模型,完成模型的管理和一键预测。配合使用Fine-tune API,可以基于大规模预训练模型快速完成迁移学习,让预训练模型能更好地服务于用户特定场景的应用。模型概述:模型概述 DeepLabv3+ 是Google DeepLab语义分割系列网络的最新作,其前作有 DeepLabv1,DeepLabv2, DeepLabv...原创 2020-01-07 06:28:28 · 3874 阅读 · 1 评论 -
百度AI攻略:Paddlehub实现图像生成
PaddleHub可以便捷地获取PaddlePaddle生态下的预训练模型,完成模型的管理和一键预测。配合使用Fine-tune API,可以基于大规模预训练模型快速完成迁移学习,让预训练模型能更好地服务于用户特定场景的应用。模型概述CycleGAN是生成对抗网络(Generative Adversarial Networks )的一种,与传统的GAN只能单向生成图片不同,CycleGAN...原创 2020-01-06 09:52:26 · 687 阅读 · 0 评论 -
百度AI攻略:Paddlehub实现关键点检测
PaddleHub可以便捷地获取PaddlePaddle生态下的预训练模型,完成模型的管理和一键预测。配合使用Fine-tune API,可以基于大规模预训练模型快速完成迁移学习,让预训练模型能更好地服务于用户特定场景的应用。模型概述人体骨骼关键点检测(Pose Estimation) 是计算机视觉的基础性算法之一,在诸多计算机视觉任务起到了基础性的作用,如行为识别、人物跟踪、步态识别等相...原创 2020-01-06 09:35:19 · 1082 阅读 · 1 评论 -
百度AI攻略:Paddlehub实现图像分类
PaddleHub可以便捷地获取PaddlePaddle生态下的预训练模型,完成模型的管理和一键预测。配合使用Fine-tune API,可以基于大规模预训练模型快速完成迁移学习,让预训练模型能更好地服务于用户特定场景的应用。本次介绍如何使用paddlehub调用vgg模型实现图像分类。模型概述VGG是牛津大学计算机视觉组和DeepMind在2014年提出的一种图像分类模型。该系列模型...原创 2020-01-06 09:28:34 · 752 阅读 · 0 评论 -
百度AI攻略:paddlehub人脸检测
PaddleHub可以便捷地获取PaddlePaddle生态下的预训练模型,完成模型的管理和一键预测。配合使用Fine-tune API,可以基于大规模预训练模型快速完成迁移学习,让预训练模型能更好地服务于用户特定场景的应用。本次介绍如何使用paddlehub实现人脸检测。模型概述Ultra-Light-Fast-Generic-Face-Detector-1MB是针对边缘计算设备或低算...原创 2020-01-06 09:18:08 · 1410 阅读 · 0 评论 -
百度AI攻略:名片识别
1.功能描述:支持对各类名片的9个关键字段进行结构化识别,包括姓名、公司、职位、邮编、邮箱、电话、网址、地址、手机号。使用名片识别技术,实现对用户名片关键信息的结构化识别和录入,可应用于线下会议、论坛、商务交流等场景,满足用户快速录入名片关键信息的需求,有效降低用户输入成本,提升用户使用体验。2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai....原创 2020-01-01 08:49:08 · 1036 阅读 · 0 评论 -
百度AI攻略:通用文字识别
1.功能描述:百度通用文字识别基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务,印刷体文字识别准确率高达99%,多项ICDAR指标居世界第一。有以下一些版本:通用文字识别对图片中的文字进行检测和识别,支持中、英、法、俄、西、葡、德、意、日、韩、中英混合等多语种识别,同时支持中、英、日、韩四语种的类型检测高精度版在通用文字识别的基础上,提供更高精度的识别服务...原创 2020-01-01 08:48:32 · 4466 阅读 · 0 评论 -
百度AI攻略:语音合成升级人群流量监控方案
1.功能描述:语音合成:基于业界领先的深度神经网络技术,提供高度拟人、流畅自然的语音合成服务,让您的应用、设备开口说话,更具个性2.特色优势支持多语言多音色支持中文、英文、中英文混读合成,提供基础音库和精品音库共9种发音人供您选择,让您的应用拥有个性化的声音丰富的场景应用支持纯在线、纯离线、离在线融合三种应用方式,支持在有网、无网、弱网环境下的合成播报,满足不同的场景需求方...原创 2019-12-31 08:29:32 · 300 阅读 · 0 评论 -
百度AI攻略:识别火车票的多种方法
1. 简介百度OCR提供多种场景下精准的图像文字识别技术服务,让您的应用看图识字,提升输入效率,优化用户体验。现在百度OCR的全系列39款产品,开放使用!希望大家能一起来测试,使用。本篇评测介绍了通过百度ORC识别火车票的多中方法。2.功能描述:火车票识别: 支持对红、蓝火车票的8个关键字段进行结构化识别,包括车票号码、始发站、目的站、车次、日期、票价、席别、姓名iOCR财会版:...原创 2019-12-31 08:28:57 · 1241 阅读 · 0 评论 -
百度AI攻略:语音识别
1.功能描述:将60秒内的语音快速识别为文字,适用于手机语音输入、语音搜索、人机对话等语音交互场景2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum/topic/show/9433273.调用攻略(Python3)及评测3.1首先认证授权:在开始调用任何API之前需要先进行认证授权,具体的说明请参考:...原创 2019-12-31 08:28:36 · 2069 阅读 · 0 评论 -
百度AI攻略:地址识别
1.功能描述:百度地址识别精准提取快递填单文本中的姓名、电话、地址信息,通过自然语言处理辅助地址识别做自动补充和纠正,生成标准规范的结构化信息,大幅提升企业效率。地址信息提取:精准提取文本填单中的地址信息,并按省、市、区、街道、详细地址的格式结构化输出地址纠正:针对地址信息中用户填错的省、市、区、街道等字段内容进行辅助纠正地址补全:结合地图POI数据,帮助补全用户在地址填写步骤中缺失的...原创 2019-12-31 08:28:16 · 3287 阅读 · 0 评论 -
百度AI攻略:二维码识别
1.功能描述:对图片中的二维码、条形码进行检测和识别,返回存储的文字信息,获取相应信息,可应用于商品、药品出入库管理及货物运输管理等场景,轻松一扫即可快速完成对物品信息的读取、登记和存储,大幅度简化物品管理流程。2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum/topic/show/9433273.调用攻略...原创 2019-12-31 08:27:23 · 1999 阅读 · 0 评论 -
百度AI攻略:图像风格转换
1.功能描述:将图像转换成卡通画或素描风格,可用于开展趣味活动或集成到美图应用2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum/topic/show/9433273.调用攻略(Python3)及评测3.1首先认证授权:在开始调用任何API之前需要先进行认证授权,具体的说明请参考:http://a...原创 2019-12-31 08:27:02 · 997 阅读 · 0 评论 -
百度AI攻略:EasyDL实现邮车查找
1、功能介绍:EasyDL平台支持定制图像分类、物体检测、图像分割三类模型。三类模型的功能区别如下:图像分类:识别一张图中是否是某类物体/状态/场景,适用于图片内容单一、需要给整张图片分类的场景物体检测:检测图中每个物体的位置、名称。适合图中有多个主体要识别、或要识别主体位置及数量的场景图像分割:对比物体检测,支持用多边形标注训练数据,模型可像素级识别目标。适合图中有多个主体、需识别其位置...原创 2019-12-31 08:26:39 · 453 阅读 · 0 评论 -
百度AI攻略:EasyDL专业版
1、简介:1.1 什么是EasyDL专业版EasyDL专业版是EasyDL在2019年10月下旬全新推出的针对AI初学者或者AI专业工程师的企业用户及开发者推出的AI模型训练与服务平台,目前支持视觉及自然语言处理两大技术方向,内置百度海量数据训练的预训练模型,可灵活脚本调参,只需少量数据可达到优模型效果。适用人群专业AI工程师且追求灵活、深度调参的企业或个人开发者支持定制模型...原创 2019-12-31 08:26:14 · 3141 阅读 · 0 评论 -
百度AI攻略:iOCR自定义模板功能
1. 功能介绍百度已经推出了iOCR财会票据识别,针对财会报销场景提出的专项解决方案,可对各类财务票据、报销单、银行回单、对账单进行自动分类及结构化识别,并支持用户为固定版式的新票据/单据自定义结构化识别模板及分类器。百度iOCR财会票据识别功能非常的强大,我在:https://ai.baidu.com/forum/topic/show/955803这篇文章里面已经进行了比较详细的介绍,大家有...原创 2019-12-31 08:25:45 · 2839 阅读 · 1 评论 -
百度AI攻略:iOCR财会票据识别
【使用攻略】+【iOCR财会票据】1.功能描述:对各类财务票据、报销单、银行回单、对账单进行自动分类及结构化识别,并支持用户为新票据/单据创建结构化模板和调整分类器。具体包括:票据、单据识别:结构化识别增值税发票、行程单、出租车票、火车票、定额发票等报销类票据,关键字段准确率达99%,银行回单、对账单,字段准确率达95%报销单识别:针对黏贴在一张纸上的多张票据自动查找边缘,切割后自动分...原创 2019-12-30 08:37:08 · 2961 阅读 · 4 评论 -
百度AI攻略:实现人体姿态判定打分
【使用攻略】【人体关键点识别】1.方案介绍百度推出了人体关键点识别,检测图像中的人体并返回人体矩形框位置,精准定位21个核心关键点,包含头顶、五官、颈部、四肢主要关节部位,支持多人检测、大动作等复杂场景。支持多人体检测,检测图像中的所有人体,标记出每个人体的坐标位置;不限人体数量,适应人体轻度遮挡、截断的情况。人体关键点识别的功能特点可以应用到体育健身,根据人体关键点信息,分析人体姿态、...原创 2019-12-30 08:36:47 · 6053 阅读 · 8 评论 -
百度AI攻略:行驶证识别
1.功能描述:对机动车行驶证主页及副页所有21个字段进行结构化识别,包括号牌号码、车辆类型、所有人、品牌型号、车辆识别代码、发动机号码、核定载人数、质量、检验记录等。可应用于网约车或货车司机身份审查等场景,有效提升信息录入效率,降低用户输入成本,提升用户使用体验。2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum...原创 2019-12-30 08:36:26 · 886 阅读 · 0 评论 -
百度AI攻略:手部关键点识别
1.功能描述:对于输入的一张图片(可正常解码,且长宽比适宜),检测图片中的所有人手,输出每只手的坐标框、21个骨节点坐标信息。2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum/topic/show/9433273.调用攻略(Python3)及评测3.1首先认证授权:在开始调用任何API之前需要先进行...原创 2019-12-30 08:35:57 · 1790 阅读 · 1 评论 -
百度AI攻略:驾驶行为识别
1.功能描述:针对车载场景,识别驾驶员使用手机、抽烟、不系安全带、双手离开方向盘等动作姿态,分析预警危险驾驶行为,提升行车安全性2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum/topic/show/9433273.调用攻略(Python3)及评测3.1首先认证授权:在开始调用任何API之前需要先进...原创 2019-12-30 08:35:42 · 4331 阅读 · 2 评论 -
百度AI攻略:人体关键点识别
第四期【百度大脑新品体验】人体关键点识别1.功能描述:检测图像中的人体并返回人体矩形框位置,精准定位21个核心关键点,包含头顶、五官、颈部、四肢主要关节部位,支持多人检测、大动作等复杂场景2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum/topic/show/9433273.调用攻略(Python3)及...原创 2019-12-30 08:35:16 · 2176 阅读 · 0 评论 -
百度AI攻略:车牌识别
1.功能描述:支持对中国大陆机动车车牌的识别,包括地域编号和车牌号2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum/topic/show/9433273.调用攻略(Python3)及评测3.1首先认证授权:在开始调用任何API之前需要先进行认证授权,具体的说明请参考:http://ai.baid...原创 2019-12-30 08:34:55 · 1794 阅读 · 0 评论 -
百度AI攻略:手势识别
1.功能描述:识别图片中的手部位置和手势类型,可识别24种常见手势,包括拳头、OK、比心、作揖、作别、祈祷、我爱你、点赞、Diss、Rock、竖中指、数字等2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum/topic/show/9433273.调用攻略(Python3)及评测3.1首先认证授权:在开...原创 2019-12-30 08:34:22 · 1819 阅读 · 1 评论 -
百度AI评测:新闻摘要
【评测报告】【新闻摘要】1.功能介绍:新闻摘要,基于深度语义分析模型,自动抽取新闻文本中的关键信息并生成指定长度的新闻摘要。可用于热点新闻聚合、新闻推荐、语音播报、APP消息Push等场景。2.平台接入新闻摘要接入网址:https://console.bce.baidu.com/ai/#/ai/imagerecognition/overview/index具体接入方式比较简单,可...原创 2019-12-30 08:33:36 · 641 阅读 · 0 评论 -
百度AI使用评测:车辆分割
【使用攻略】【车辆分割】1.功能介绍:传入单帧图像,检测图像中的车辆,以小汽车为主,识别车辆的轮廓范围,与背景进行分离,返回分割后的二值图、灰度图、前景抠图,支持多个车辆、车门打开、后备箱打开、机盖打开、正面、侧面、背面等各种拍摄场景。2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum/topic/show/...原创 2019-12-30 08:33:08 · 528 阅读 · 0 评论 -
百度AI评测:红酒识别
【评测报告】【红酒识别】1.功能介绍:识别红酒名称:识别图像中的红酒标签,返回中英文红酒名称,可识别数十万中外红酒,准确率95%以上返回详细红酒介绍:整合红酒信息服务应用“酒咔嚓”的专业数据,支持返回红酒的国家、产区、酒庄、类型、糖分、葡萄品种、酒品描述等详细信息配合手机APP拍摄可以提供详细的红酒介绍,同时可结合识别结果进一步为用户提供商品推荐、营养搭配等服务,帮您更好的消费红酒,适...原创 2019-12-29 09:28:19 · 1109 阅读 · 0 评论 -
百度AI使用方案:黑白图片上色
【使用攻略】【评测报告】【黑白图像上色】1.功能描述:百度智能识别黑白图像内容并填充色彩,使黑白图像变得鲜活,让老照片重新焕发活力。本文针对黑白图像上色功能开发了使用攻略,提供全套代码,并与其他厂商的产品进行对比评测,为大家使用提供依据。2.平台接入黑白图像上色接入网址:https://console.bce.baidu.com/ai/#/ai/imageprocess/overv...原创 2019-12-29 09:28:00 · 3458 阅读 · 2 评论 -
百度AI应用方案:人群流量预警
【使用攻略】【人流量统计】1 整体说明每年寒暑假,五一,十一,春运等时候,特定的旅游景点,车站等地区会有大量的人流。而在一个地区,人流密度过大很容易造成踩踏事故。人流量统计可以统计图像中的人体个数和流动趋势,与监控技术结合起来,可以提前预警,进而避免悲剧的发生。针对这一方面我前期曾经写过一个自动告警的方案,这次人流量统计又有了进一步的升级,支持area参数框选多个区域进行局部人数统计,可以对...原创 2019-12-29 09:27:37 · 612 阅读 · 0 评论 -
百度AI攻略:网络图片文字识别
1.功能描述:依托全网海量优质数据和业界领先的深度学习技术针对网络图片进行优化识别,支持更多网络字体和复杂背景下的文字识别2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum/topic/show/9433273.调用攻略(Python3)及评测3.1首先认证授权:在开始调用任何API之前需要先进行认证...原创 2019-12-29 09:26:48 · 732 阅读 · 0 评论 -
百度AI攻略:手写文字识别
1.功能描述:支持对图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化,识别准确率可达90%以上2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum/topic/show/9433273.调用攻略(Python3)及评测3.1首先认证授权:在开始调用任何API之前需要先进行认证授...原创 2019-12-29 09:26:08 · 3163 阅读 · 0 评论 -
百度AI攻略:银行卡识别
1.功能描述:支持对主流银行卡的卡号、有效期、发卡行、卡片类型4个关键字段进行结构化识别,识别准确率超过99%2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum/topic/show/9433273.调用攻略(Python3)及评测3.1首先认证授权:在开始调用任何API之前需要先进行认证授权,具...原创 2019-12-29 09:25:26 · 1182 阅读 · 0 评论 -
百度AI攻略:出租车票识别
1.功能描述:支持识别全国各大城市出租车票的6个关键字段,包括发票号码、代码、车号、日期、时间、金额。使用出租车票识别技术,实现对发票号码、日期、时间、金额等信息的自动识别和录入,应用于企业税务核算及内部报销等场景,能够有效减少人工核算工作量,降低人力成本,实现财税报销的自动化2.平台接入出租车票识别接入网址:https://console.bce.baidu.com/ai/#/a...原创 2019-12-29 09:24:52 · 1348 阅读 · 0 评论 -
百度AI攻略:通用物体识别
1.功能描述:基于深度学习及大规模图像训练,准确识别图片中的物体、场景信息。可以应用于:相关内容及广告推荐:对用户浏览网页中图片进行分析,识别图片内容给出相关内容推荐或广告展示。相册分类及智能美图:批量读图实现相册智能分类管理。通用物体与场景识别进行了能力升级——模型升级,Top1准确率绝对值提升7%,业界领先!具体如下图所示:2.平台接入通用物体与场景识别接入网址:http...原创 2019-12-29 09:24:30 · 2833 阅读 · 0 评论 -
百度AI攻略:植物识别
1.功能描述:该请求用于识别一张图片,即对于输入的一张图片(可正常解码,且长宽比较合适),输出植物识别结果。近期植物识别进行了能力升级——模型升级,Top1准确率绝对值提升11.76%,精度保持业界领先!具体如下图所示:2.平台接入植物识别接入网址:https://console.bce.baidu.com/ai/?fromai=1#/ai/imagerecognition/ove...原创 2019-12-29 09:23:53 · 4462 阅读 · 6 评论 -
百度AI攻略:车辆属性识别
1.功能描述:检测图像中的各类车辆,并针对小汽车识别11种外观属性,包括:是否有车窗雨眉、是否有车顶架、副驾驶是否有人等,可用于交通安防场景的特定车辆检测追踪。2.平台接入车辆属性识别接入网址:http://ai.baidu.com/tech/vehicle/attr具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum/t...原创 2019-12-28 07:36:16 · 2739 阅读 · 2 评论 -
百度AI应用方案:健康饮食APP
1.需求及方案:随着生活水平的提高,人们都希望能健康饮食,这就需要对食材有更加深入的了解。百度AI果蔬类食材识别,根据拍摄照片,识别图片中果蔬名称。本文结合百度AI果蔬类食材识别与百度百科,食物卡路里信息整合,为用户提供营养价值、搭配禁忌等方面信息,让大家可以更加健康的饮食。2.平台接入食材识别接入网址:https://console.bce.baidu.com/ai/#/ai/ima...原创 2019-12-28 07:35:40 · 1485 阅读 · 1 评论