AI 数据库me

专注于多模态数据采集、大数据处理、人工智能数据加工等方面的研究;分享人工智能技术知识,训练数据,算法研究等干货。

  • 博客(45)
  • 收藏
  • 关注

原创 目标检测技术的详解

目标检测的前世今生——数据堂目标检测历程(编年体)目标检测历程(纪传体)目标检测的发展历程,主要分为两个阶段,传统的目标检测算法和基于深度学习的目标检测算法。1. 传统的目标检测算法1.1 Harr-likePaper:Rapid Object Detection using a Boosted Cascade of Simple Features(CVPR 2001)核心算法:...

2020-03-31 22:17:58 256

原创 AI数据质检解决方案:为算法把好最后一道关

DC预测,2020年全球将拥有35ZB数据量。随着人工智能的发展,人工智能多模态、非结构化数据量愈发庞大,数据种类逐步复杂化,多模数据组合标注等需求进一步显现出来。数据的获取方式从企业AI数据需求角度出发,获取数据的形式主要为自行生产和委托数据服务企业两种形式。在数据服务行业中,一般也通过自制、众包、外包三种模式完成数据处理业务,这三种模式优劣势也非常明显。自制:优势:标准唯一数据质量高...

2020-03-30 21:34:34 653

原创 自动驾驶技术为什么需要这些复杂数据?

有报道称,奥迪已于2019年底,正式取消了L3级自动驾驶研发项目,转向L2和L4级自动驾驶技术研发。就在一周前,奇瑞汽车发布了一张带有“鸿蒙”字样的新车海报又快速删除,外界猜测“鸿蒙”终于上车了。▲奥迪A8的L3级系统海外演示,驾驶员在看电视揭开自动驾驶的神秘面纱在圈外人眼中,自动驾驶是一个复杂庞大而且难以理解的工程。其实,它的原理非常简单,概括来说主要是环境感知系统、中央决策系统、底层执行...

2020-03-27 21:09:51 919

原创 开源NLP标注工具及NLP数据集

开源NLP标注工具技术分享数据堂 AI-Lab一、什么是标注平台自然语言处理标注工具是指通过可视化界面,以清晰、快捷的方式对文本数据进行标注的工具,该工具通常以系统形式展现,包含前端展示、后端系统与数据库三部分组成。二、自然语言标注平台能做什么文本分类(对文本类型进行划分,如情感分类、企业类型分类等)命名实体识别(对文本实体进行标注,如人名、地名、实体名等等)关系抽取任务(对文本中词...

2020-03-26 20:13:34 631

原创 AIDATANG_1505ZH:一种用于深度学习的大规模汉语语音语料库

AIDATANG_1505ZH:一种用于深度学习的大规模汉语语音语料库文章来源:数据堂网址:https://www.datatang.com/前言:近年来,深度学习在语音识别领域取得了突破性进展,现在,几乎所有的语音技术研究都直接或间接采用神经网络模型,语音识别准确率得到了明显提升,并推动语音识别技术广泛应用到人们的日常生活中。这得益于算法的持续创新和算力的不断提升。不同于统计学习模型,神...

2020-03-24 17:57:33 497

原创 深度学习计算机视觉从入门到精通——目标检测技术经典算法讲解

本篇文章:深度学习计算机视觉从入门到精通——目标检测技术经典算法讲解接上一篇:《深度学习计算机视觉从入门到精通——目标检测技术及常用数据集》文章链接:https://blog.csdn.net/weixin_44532659/article/details/104989643一、目标检测技术经典算法讲解经典算法讲解——RCNNSelective Search经典算法讲解——Fast...

2020-03-23 17:21:44 301

原创 深度学习计算机视觉从入门到精通——目标检测技术及常用数据集

深度学习计算机视觉从入门到精通——目标检测原理与深度实战分享者:人工智能实验室:赵世智一、概述及应用目标检测概述找出图像中所有感兴趣的目标,以矩形框的形式确定它们的位置和大小,并确定该目标的类别。由于各类物体有不同的外观,形状,姿态,加上成像时光照,遮挡等因素的干扰,目标检测一直是机器视觉领域具有挑战性的问题。目标检测应用安防:人脸检测和手指检测,为人脸识别与指纹识别提供有效的区域...

2020-03-20 15:17:57 213

原创 人工智能语音训练数据的制作方式?

语音数据指标解读一、语音数据类型按照话语的自然程度分类:朗读式语音对话式语音按照信号频宽角度分类手机信道语音电话信道语音桌面语音(高保真麦克风或阵列)按照应用角度分类基础识别数据基础语音识别能力的训练数据可分为:朗读语音、自然对话、引导语音、噪音环境、情感语音、声纹识别等六大类语音数据。智能家居数据3000小时中国儿童语音数据797人低幼儿童中文语音数据...

2020-03-19 21:21:42 524

原创 如何构建语音识别能力?有哪些语音数据集?

语音已经是目前市场上的人工智能产品的主要入口之一,语音识别也是当前人工智能领域的重点研究方向,在家居、汽车、机器人等方面有着广泛的应用,未来也将深入到我们学习、生活、工作的各个环节。随着人工智能的快速发展,国内外科技巨头不断推出自己的应用产品。百度旗下的DuerOS已经成了国内规模最大、最活跃、生态最繁荣的对话式人工智能操作系统。从驾车时“小度小度,导航回家”到小度在家智能音箱快速进入千家万户。...

2020-03-18 22:31:29 1110

原创 有哪些人脸检测开源数据集?

基于深度学习的人脸检测技术研究人脸与关键点检测概述人脸检测-- 找出图像中的所有人脸位置,通常用一个矩形框Input(img) output( N*(X,Y,W,H) )人脸关键点检测人脸关键点检测也称为人脸关键点、定位或者人脸对齐定位出人脸面部的关键区域位置:1、眉毛2、眼睛3、鼻子4、嘴巴5、脸部轮廓等。人脸检测的应用人脸检测开源数据集人脸关键点:LS3D-...

2020-03-17 19:52:09 694

原创 深度卷积网络原理与模型介绍

深度学习计算机视觉从入门到精通——深度卷积网络原理与模型介绍来自数据堂人工智能实验室的分享数据实验室:https://www.datatang.com/laboratory?dw=news一、卷积神经网络原理1.1神经网络最基本单元—神经元1943年心理学家McCulloch和数学家W.Pitts在分析总结神经元基本特性的基础上首先提出的M-P模型美国学者Rosenblatt 于195...

2020-03-16 21:44:40 237

原创 开源NLP标注工具技术分享

开源NLP标注工具技术分享来自:数据堂 AI-Lab自然语言标注平台能做什么文本分类(对文本类型进行划分,如情感分类、企业类型分类等)命名实体识别(对文本实体进行标注,如人名、地名、实体名等等)关系抽取任务(对文本中词关系,如主谓宾等,或因果关系等)机器翻译任务(通过平行语料,构建翻译对)其他NLP相关任务标注工具汇总导出数据样式标注工具介绍DoccanoDoccan...

2020-03-13 15:35:16 779

原创 汉语韵律短语切分方法初探

韵律简介语音合成任务流程语音合成合成器生成语音波形,其过程如下:①文本分析处理,即按照语义、语法等规则对文本进行分词和标注,将文本序列转换成字的音节序列。②根据语境、韵律规则和韵律模型,为每个音节或词组调整韵律参数,将音节序列转换成音韵序列。③运用语音合成技术,按要求合成出高质量的语音流。韵律概念■ 韵律是语言交际的重要元素,是一种听觉和感知相结合的概念,它能帮助听者理解说话者要表...

2020-03-12 22:07:38 508 1

原创 有哪些手势识别数据?

手势识别可以被视为计算机理解人体语言的方式,从而在机器和人之间搭建更丰富的桥梁。目前主要采用的是深度学习的方式进行手势识别,这就需要大量的数据去训练机器看懂人的手势。比如,我们采取21点标注法,这是现在手势识别普遍采用的标注方法,即将一只手的骨架进行21个关键点的标注,用来生成手部训练数据的标签。AI 时代,手势识别交互方式的加入,让我们与机器有了更多互动的可能。虽然目前手势识别还处在行业早...

2020-03-10 07:33:05 659

原创 如何提升语音识别技术的识别能力?

语音识别技术(Automatic Speech Recognition, ASR)是计算机听觉领域中重要的研究方向之一。其目标是就是让机器把语音信号转变为相应的文本,进而达到机器自动识别和理解语音内容。语音识别作为一种基础层感知类技术,既可以作为核心技术直接应用于终端产品,也可以仅作为一种感知类辅助技术集成于语音助手、车载系统、智慧医疗、智慧法院等场景的产品中。—语音识别系统原理—目前语音识别...

2020-03-09 22:48:58 758

原创 如何制作多语种发音词典?多语种发音词典的制作方法!

多语种发音词典制作方法分享本文分享者:数据堂 AI-Lab & 数据产品中心 王丽媛一、为什么制作发音词典(一)、因为发音词典使用广泛语音识别、语音合成。在语音合成数据制作中,文本标注环节需着重处理音素标注问题。(二)、独立数据资产数据产品市场的热门数据资源产品发音词典和语种一一对应:一个语种只需要一个发音词典发音词典里包含的词汇尽可能全,至少包含语音数据里的所有词可...

2020-03-06 16:46:58 339 1

原创 人工智能都有哪些应用场景?需要哪些训练数据?

本文主要介绍人工智能的应用场景。人工智能的三大技术领域一、语音技术的应用场景及数据1、智能手机自苹果发布Siri后,智能手机作为语音技术的第一主战场,目前的应用已经成熟。智能手机应用:语音输入法、语音助手、语音搜索、给APP增加语音入口2、智能家居在家庭物联网大力发展的时代,多种智能硬件推动智能家居产品进入爆发期。智能家居应用:智能音箱、智能家电、儿童故事机、陪伴机器人等...

2020-03-05 19:00:43 600

原创 自动驾驶数据有哪些?

自动驾驶数据标注能力基于客户需求对海量原始数据进行框选、提取、分类等一系列处理,将混杂数据转化为机器学习可识别的智能驾驶专业数据,帮助驾驶技术更好的感知实际道路、车辆位置和障碍物信息、疲劳检测等,实时感知在途风险,实现智能行车、自动泊车等预定目标。标注类别包含:3D雷达点云、track id、freespace(可行驶区域、边界线、分割)、人体(拉框、标点、ofo)、车辆(拉框、3D标点)、车...

2020-03-04 18:04:54 701

原创 人体属性检测与深度实战

深度学习计算机视觉从入门到精通——人体属性检测与深度实战说明:本文来自数据堂人工智能实验室(AI Lab )深度学习计算机视觉从入门到精通第六讲人体属性检测与深度实战。主讲人:丁勇一、人体属性检测介绍1.1人体属性检测概述总体来讲人体属性检测在机器视觉方面可以概括为:给定人体框,通过分析人体属性特征与图像低层特征的映射关系,检验或识别出人体框中的视觉语义特征。1.2人体属性检测处理流...

2020-03-03 18:09:31 884 1

转载 Kaldi的MFCC特征提取代码分析

Kaldi的MFCC特征提取代码分析本文转载自微信公众号:433的3号同学make_mfcc.sh脚本首先看顶层脚本make_mfcc.sh,地址:https://github.com/kaldi-asr/kaldi/blob/master/egs/wsj/s5/steps/make_mfcc.sh。使用方式如下:./steps/make_mfcc.sh Usage: ./steps/...

2020-03-02 19:51:45 682

原创 图像分割 | 人体实例分割数据

图像分割(image segmentation)技术是计算机视觉领域的一个重要的研究方向,是图像语义理解的重要一环。图像分割是指将图像分成若干具有相似性质的区域的过程。该技术相关的场景物体分割、人脸人体Parsing、人体前背景分割、三维重建等技术被广泛应用于无人驾驶、手机应用、增强现实、安防监控等领域。AI技术的三个要素:算法、数据和应用场景,数据是非常重要的。算法会快速的迭代更新,但是数据的...

2020-02-28 19:01:58 1298

原创 3D点云标注工具

日前,美团“无人配送防疫助力计划”而启用的无人配送车也宣布在北京市顺义、海淀等地投放,实现“无接触配送”。图片来自于网络无人驾驶技术的快速发展,使得无人配送车、无人消毒车等搭载着该技术的各类自主机器人冲上了抗疫前线,建起一道安全、无接触的防护壁垒。无人驾驶技术的实现在无人驾驶技术中,环境感知系统充当无人驾驶车的“眼睛”,主要是通过无人驾驶汽车所装载的外部传感器获取外部环境信息,对其进行建模...

2020-02-27 18:45:28 2365

原创 人体属性识别数据集

人像属性检索常用于刑侦中为公安破案提供有效线索,提高破案速度。还可以在安全生产领域以及商业领域。目前人像属性检索主要性能指标在人像属性识别精度上,虽然目前在公开数据集上达到了不错的成绩,但是由于实际场景的复杂多样性,地点随机,且光线、角度、姿态不同,再加上人体容易受到检测精度、遮挡等因素的影响,属性标签识别并不理想,实际应用中精度并不是很高。【监控人体属性数据】推荐,提取包括人的生理特征(如性...

2020-02-26 20:27:14 873 2

转载 如何有效的获得高质量的大规模标注数据?

本文为亚利桑那州立大学在读计算机博士生周耀的2018年独家投稿,他给大家介绍了一个基于机器教学为基础的自适应交互型众包教学框架——JEDI ,它假设每个 learner 都有指数型的记忆遗忘曲线,并且能够保证教学的有效性,多样性,以及教学样本的质量。作者的原论文(http://cn.arxiv.org/abs/1804.06481)入选了2018的 KDD 会议。以下为投稿全文。在很多机器学习的...

2020-02-25 16:18:41 359

原创 基于《Kaldi语音识别》技术及开源语音语料库分享

前言:数据堂自AI开源计划发起,面向高校和科研机构首次开源的【1505小时中文普通话语音数据集】,该数据集句标注准确率达到了98%,得到了很多开发者的认可。不仅如此,数据堂基于此开源数据集还精选出了【200小时中文普通话语音数据】同期发布,并提供了基于Kaldi【200小时中文普通话语音数据】训练方法。该训练方法同时得到了广泛的关注及开发者的极度认可,并表示希望数据堂持续分享相关技术。日前,...

2020-02-24 20:15:20 1198

翻译 最大规模开源说话人识别语料集——VoxCeleb

文章题目:VoxCeleb: a large-scale speaker identification datasetVoxCeleb2: Deep Speaker Recognition文章地址:http://www.robots.ox.ac.uk/~vgg/publications/2017/Nagrani17/nagrani17.pdf http://www.robots.ox.ac...

2020-02-21 20:07:31 1224 2

原创 说话人识别声纹语音数据库CN-Celeb

分享:CN-Celeb 是由清华大学语音和语言技术中心(CSLT)近日公布的一个中国明星声纹库。该声纹库包含1,000名中国明星(包括歌星、影星、说唱艺人等)在采访、歌舞及影视作品中的声音片段。每位明星的声音时长大约20分钟,整个数据集近300小时。该数据包含了11类实际场景,覆盖了噪音、信道、发音方式等各方面的复杂性,特别适合研究复杂场景下的说话人识别技术。研究者可在共享资源网站 http:/...

2020-02-20 19:38:05 931

原创 如何提高语音识别模型的准确率?

“智能客服+人工坐席”的新型客户服务模式,通过自动化的语音识别技术,降低客服中心的人力成本,提升客服中心的运营效率。应用场景:客服质检、机器人外呼、语音导航智能客服和领域非常相关,不同领域的话题各不相同,还有大量的领域词汇,所以需要根据不同领域来训练相应的语音识别模型。客服语音识别的技术挑战:1、有些客户普通话口音重:不同地域有不同的口音特点2、自然风格说话:语速快、吐字不清、抢话叠字...

2020-02-18 16:43:13 962 1

原创 如何解决TTS个性化场景数据?

个性化TTS应用智能交互、自动客服、虚拟主持人个性化TTS数据如何解决?专业TTS数据制作为产品塑造独特声音形象:根据产品特点筛选符合音色的声优,高标准录制数十小时音库数据采集:中文、英文、中英混杂数据标注:发音校对、音素转写、音素边界切分、韵律标注、词性标注、重音标注、发音词典制作案例:美式英语TTS数据制作发音人:美国女声数据量:2万句,20小时录音环境:专业录音室,专业麦...

2020-02-14 18:10:50 339

原创 基于端到端的语音处理的PPT

分享:在 interspeech上,ESPnet的作者们分享了**一篇基于端到端的语音处理的PPT,**这篇PPT内容包含了ASR,TTS,NLU,MT等,题目为《Advanced Methods for Neural End-to-End Speech Processing》在这篇PPT中,作者们把所有遇到的问题都通过ESPnet来完成,并且提供了大量的案例研究和实践教程,作者们希望通过这篇...

2020-02-12 18:07:05 336

转载 语音切割,个人VAD系统(google 2019 论文译文 )-整理

发现了一篇不错的内容~语音切割,个人VAD系统(google 2019 论文译文 ):整理在:https://www.datatang.com/news/info/laboratory/273也是转载:CSDN博客陶瑞同学,不同的是已经整理成了PDF文件,方便保存,不懂怎么上传文件,想要文件的朋友留言吧~...

2020-02-12 14:14:43 162

原创 人脸活体检测数据

人脸活体检测丨丰巢“刷脸取件”被小学生破解背后的秘密前些日,#小学生发现刷脸取件bug#的话题引发关注!浙江嘉兴上外秀洲外国语学校402班科学小队向媒体爆料:他们在一次课外科学实验中发现,只要用一张打印照片就能代替真人刷脸,骗过小区里的丰巢智能柜,最终取出父母们的货件。一张打印的照片,就可以骗过快递柜的人脸识别系统,丰巢的人脸识别取件技术备受质疑。对此,@丰巢智能柜 官方微博进行回应,表示...

2020-02-11 18:55:33 632

原创 智能驾驶数据集 合集

智能驾驶,加速驶进未来新世界据麦肯锡统计,至2030年智能驾驶市场将超过5000亿美元。在智能驾驶行业,根据应用场景的不同,目前较热门的领域主要集中在驾驶与泊车。智能驾驶技术真正做到商业化落地,需要不断提高智能驾驶算法的安全性。智能驾驶图像数据No.1103,300张驾驶员行为标注数据【驾驶员行为标注数据】总数据量103,300张,车内摄像头拍摄,且采集多年龄段、多时段、多种驾驶行为...

2020-02-11 18:52:24 981

原创 智能抗疫 | 戴口罩人脸数据助力科技防疫

新冠肺炎疫情防控牵动着国人的心,同时也是中国科技实力的一次临场考验。“提升科技防控疫情力度,积极为打赢疫情防控阻击战作出贡献。”1月29日,国资委主任郝鹏表示。帮助安检及医护人员提高疫情检测与防护效率,是筑起疫情防控的“第一道防线”。(国资委疫情工作领导小组深入企业进行专题调研)国内人工智能前沿企业及互联网企业积极发挥领军作用,正在把 AI 技术投入到新型冠状病毒疫情防控中。依图“医疗机器...

2020-02-10 14:29:41 1178

原创 2019年人工智能产业发展调研报告

2019年人工智能产业发展调研报告人工智能(AI)起源于上世纪50年代,在此后的半个多世纪中,历经了“逻辑推理”、“知识工程”的两起两落。目前,随着智能算力与数据瓶颈得以解决,在AlphaGo战胜围棋世界冠军的震撼中,“人工智能+”逐渐与各行业深度融合、走向繁荣。从全球产业发展来看,人工智能是第四次科技革命的主要技术之一,也是全球竞争的主战场,关系着国家发展前途和命运。历史上每一次科技革命,通...

2019-11-14 17:25:41 1794

原创 智能垃圾识别训练数据

智能垃圾分类技术将会是人工智能在分类领域的一个重要的研究方向,一般的图像识别都会基于样本的特征进行分类,而这种样本在某些特征上相似,细节不一样。比如特定目标的人脸识别,就可以根据五官的相对距离来判断目标是否匹配。同样的,垃圾分类数据采集不仅需要大量的样本支持,还需要精确地分类以及多样性的采集方式,即多角度、多背景的复杂样本数据采集。数据堂最新自制数据推荐:72000张 生活垃圾采集数据7200...

2019-08-01 15:23:29 2213 3

原创 基于《Kaldi语音识别》技术及开源语音语料库分享(上)

基于《Kaldi语音识别》技术及开源语音语料库分享(上)前言:数据堂自AI开源计划发起,面向高校和科研机构首次开源的【1505小时中文普通话语音数据集】,该数据集句标注准确率达到了98%,得到了很多开发者的认可。不仅如此,数据堂基于此开源数据集还精选出了【200小时中文普通话语音数据】同期发布,并提供了基于Kaldi【200小时中文普通话语音数据】训练方法。该训练方法同时得到了广泛的关注及开...

2019-07-02 13:19:07 2293 7

原创 各国外语语音数据有哪些?

自语音识别技术进入深度学习时代,语音识别准确率突飞猛进,并已经进入产品实用化阶段。不过,随着细分市场的出现,远场语音识别、命令词语音识别、方言语音识别、少数民族语音识别、小语种语音识别需要,产生大量的细分语音标注数据产品需求。推荐十国外语语音系列数据:1000小时 印度英语语音数据760 小时 印地语语音数据1000小时 巴西葡萄牙语语音数据1440小时 意大利语语音数据1800小时 ...

2020-03-11 19:42:39 37

原创 跨年龄数据显神威!人脸识别让“天下无拐”

跨年龄数据显神威!人脸识别让“天下无拐”前言:研究人员对0岁-18岁的人脸的成长变化进行模拟建模,采用深度神经网络算法来学习这些人脸在成长过程中的复杂变化。经过成千上万次的模型训练,终于训练出了一个可以进行跨年龄人脸识别的深度神经网络模型AI圈的大事件!根据腾讯优图实验室跨年龄人脸识别技术的圈定,警方进一步进行DNA亲子鉴定,结果找到了4位走失大约10年的孩子。这在国内尚属第一次。跨年龄人...

2019-11-14 17:41:57 104

原创 《钢铁侠》酷炫的手势识别黑科技,离我们的生活不远了

《钢铁侠》酷炫的手势识别黑科技,离我们的生活不远了早在语言出现之前,人类就习惯使用肢体和手势,这种近乎本能的沟通方式来互相交流。《钢铁侠》里的那位傲娇多金的学霸总裁。在实验室里打造铁甲战衣时,他的手在半空中任意转动,抓、拿、拨动,而那件充满黑科技的盔甲便在空中随着手的不断动作应运而生,简直不要太炫酷了。这种技术已经离人们的生活不远了:智能家居——回到家,你不用担心找不到开关,挥挥手就能开灯...

2019-11-14 16:16:08 127

空空如也

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除