数据堂官方账号-CSDN博客

原创目标检测技术的详解

目标检测的前世今生——数据堂目标检测历程（编年体）目标检测历程（纪传体）目标检测的发展历程，主要分为两个阶段，传统的目标检测算法和基于深度学习的目标检测算法。1. 传统的目标检测算法1.1 Harr-likePaper：Rapid Object Detection using a Boosted Cascade of Simple Features(CVPR 2001)核心算法：...

2020-03-31 22:17:58 3819

原创 AI数据质检解决方案：为算法把好最后一道关

DC预测，2020年全球将拥有35ZB数据量。随着人工智能的发展，人工智能多模态、非结构化数据量愈发庞大，数据种类逐步复杂化，多模数据组合标注等需求进一步显现出来。数据的获取方式从企业AI数据需求角度出发，获取数据的形式主要为自行生产和委托数据服务企业两种形式。在数据服务行业中，一般也通过自制、众包、外包三种模式完成数据处理业务，这三种模式优劣势也非常明显。自制：优势：标准唯一数据质量高...

2020-03-30 21:34:34 3287

有报道称，奥迪已于2019年底，正式取消了L3级自动驾驶研发项目，转向L2和L4级自动驾驶技术研发。就在一周前，奇瑞汽车发布了一张带有“鸿蒙”字样的新车海报又快速删除，外界猜测“鸿蒙”终于上车了。▲奥迪A8的L3级系统海外演示，驾驶员在看电视揭开自动驾驶的神秘面纱在圈外人眼中，自动驾驶是一个复杂庞大而且难以理解的工程。其实，它的原理非常简单，概括来说主要是环境感知系统、中央决策系统、底层执行...

2020-03-27 21:09:51 3088

原创开源NLP标注工具及NLP数据集

开源NLP标注工具技术分享数据堂 AI-Lab一、什么是标注平台自然语言处理标注工具是指通过可视化界面，以清晰、快捷的方式对文本数据进行标注的工具，该工具通常以系统形式展现，包含前端展示、后端系统与数据库三部分组成。二、自然语言标注平台能做什么文本分类（对文本类型进行划分，如情感分类、企业类型分类等）命名实体识别（对文本实体进行标注，如人名、地名、实体名等等）关系抽取任务（对文本中词...

2020-03-26 20:13:34 3774

原创深度学习计算机视觉从入门到精通——目标检测技术经典算法讲解

本篇文章：深度学习计算机视觉从入门到精通——目标检测技术经典算法讲解接上一篇：《深度学习计算机视觉从入门到精通——目标检测技术及常用数据集》文章链接：https://blog.csdn.net/weixin_44532659/article/details/104989643一、目标检测技术经典算法讲解经典算法讲解——RCNNSelective Search经典算法讲解——Fast...

2020-03-23 17:21:44 1458

原创深度学习计算机视觉从入门到精通——目标检测技术及常用数据集

深度学习计算机视觉从入门到精通——目标检测原理与深度实战分享者：人工智能实验室：赵世智一、概述及应用目标检测概述找出图像中所有感兴趣的目标，以矩形框的形式确定它们的位置和大小，并确定该目标的类别。由于各类物体有不同的外观，形状，姿态，加上成像时光照，遮挡等因素的干扰，目标检测一直是机器视觉领域具有挑战性的问题。目标检测应用安防：人脸检测和手指检测，为人脸识别与指纹识别提供有效的区域...

2020-03-20 15:17:57 1099

原创人工智能语音训练数据的制作方式？

语音数据指标解读一、语音数据类型按照话语的自然程度分类：朗读式语音对话式语音按照信号频宽角度分类手机信道语音电话信道语音桌面语音（高保真麦克风或阵列）按照应用角度分类基础识别数据基础语音识别能力的训练数据可分为：朗读语音、自然对话、引导语音、噪音环境、情感语音、声纹识别等六大类语音数据。智能家居数据3000小时中国儿童语音数据797人低幼儿童中文语音数据...

2020-03-19 21:21:42 2975

原创如何构建语音识别能力？有哪些语音数据集？

语音已经是目前市场上的人工智能产品的主要入口之一，语音识别也是当前人工智能领域的重点研究方向，在家居、汽车、机器人等方面有着广泛的应用，未来也将深入到我们学习、生活、工作的各个环节。随着人工智能的快速发展，国内外科技巨头不断推出自己的应用产品。百度旗下的DuerOS已经成了国内规模最大、最活跃、生态最繁荣的对话式人工智能操作系统。从驾车时“小度小度，导航回家”到小度在家智能音箱快速进入千家万户。...

2020-03-18 22:31:29 2582 1

原创有哪些人脸检测开源数据集？

基于深度学习的人脸检测技术研究人脸与关键点检测概述人脸检测-- 找出图像中的所有人脸位置，通常用一个矩形框Input(img) output( N*(X,Y,W,H) )人脸关键点检测人脸关键点检测也称为人脸关键点、定位或者人脸对齐定位出人脸面部的关键区域位置：1、眉毛2、眼睛3、鼻子4、嘴巴5、脸部轮廓等。人脸检测的应用人脸检测开源数据集人脸关键点：LS3D-...

2020-03-17 19:52:09 4768

原创深度卷积网络原理与模型介绍

深度学习计算机视觉从入门到精通——深度卷积网络原理与模型介绍来自数据堂人工智能实验室的分享数据实验室：https://www.datatang.com/laboratory?dw=news一、卷积神经网络原理1.1神经网络最基本单元—神经元1943年心理学家McCulloch和数学家W．Pitts在分析总结神经元基本特性的基础上首先提出的M－P模型美国学者Rosenblatt 于195...

2020-03-16 21:44:40 1602

原创开源NLP标注工具技术分享

开源NLP标注工具技术分享来自：数据堂 AI-Lab自然语言标注平台能做什么文本分类（对文本类型进行划分，如情感分类、企业类型分类等）命名实体识别（对文本实体进行标注，如人名、地名、实体名等等）关系抽取任务（对文本中词关系，如主谓宾等，或因果关系等）机器翻译任务（通过平行语料，构建翻译对）其他NLP相关任务标注工具汇总导出数据样式标注工具介绍DoccanoDoccan...

2020-03-13 15:35:16 3883

原创汉语韵律短语切分方法初探

韵律简介语音合成任务流程语音合成合成器生成语音波形，其过程如下：①文本分析处理，即按照语义、语法等规则对文本进行分词和标注，将文本序列转换成字的音节序列。②根据语境、韵律规则和韵律模型，为每个音节或词组调整韵律参数，将音节序列转换成音韵序列。③运用语音合成技术，按要求合成出高质量的语音流。韵律概念■ 韵律是语言交际的重要元素，是一种听觉和感知相结合的概念，它能帮助听者理解说话者要表...

2020-03-12 22:07:38 2322 2

原创如何提升语音识别技术的识别能力？

语音识别技术（Automatic Speech Recognition, ASR）是计算机听觉领域中重要的研究方向之一。其目标是就是让机器把语音信号转变为相应的文本，进而达到机器自动识别和理解语音内容。语音识别作为一种基础层感知类技术，既可以作为核心技术直接应用于终端产品，也可以仅作为一种感知类辅助技术集成于语音助手、车载系统、智慧医疗、智慧法院等场景的产品中。—语音识别系统原理—目前语音识别...

2020-03-09 22:48:58 2758

原创如何制作多语种发音词典？多语种发音词典的制作方法！

多语种发音词典制作方法分享本文分享者：数据堂 AI-Lab & 数据产品中心王丽媛一、为什么制作发音词典（一）、因为发音词典使用广泛语音识别、语音合成。在语音合成数据制作中，文本标注环节需着重处理音素标注问题。（二）、独立数据资产数据产品市场的热门数据资源产品发音词典和语种一一对应：一个语种只需要一个发音词典发音词典里包含的词汇尽可能全，至少包含语音数据里的所有词可...

2020-03-06 16:46:58 2129 1

原创人工智能都有哪些应用场景？需要哪些训练数据？

本文主要介绍人工智能的应用场景。人工智能的三大技术领域一、语音技术的应用场景及数据1、智能手机自苹果发布Siri后，智能手机作为语音技术的第一主战场，目前的应用已经成熟。智能手机应用：语音输入法、语音助手、语音搜索、给APP增加语音入口2、智能家居在家庭物联网大力发展的时代，多种智能硬件推动智能家居产品进入爆发期。智能家居应用：智能音箱、智能家电、儿童故事机、陪伴机器人等...

2020-03-05 19:00:43 4712

原创自动驾驶数据有哪些？

自动驾驶数据标注能力基于客户需求对海量原始数据进行框选、提取、分类等一系列处理，将混杂数据转化为机器学习可识别的智能驾驶专业数据，帮助驾驶技术更好的感知实际道路、车辆位置和障碍物信息、疲劳检测等，实时感知在途风险，实现智能行车、自动泊车等预定目标。标注类别包含：3D雷达点云、track id、freespace（可行驶区域、边界线、分割）、人体（拉框、标点、ofo）、车辆（拉框、3D标点）、车...

2020-03-04 18:04:54 4338

原创人体属性检测与深度实战

深度学习计算机视觉从入门到精通——人体属性检测与深度实战说明：本文来自数据堂人工智能实验室（AI Lab ）深度学习计算机视觉从入门到精通第六讲人体属性检测与深度实战。主讲人：丁勇一、人体属性检测介绍1.1人体属性检测概述总体来讲人体属性检测在机器视觉方面可以概括为：给定人体框，通过分析人体属性特征与图像低层特征的映射关系，检验或识别出人体框中的视觉语义特征。1.2人体属性检测处理流...

2020-03-03 18:09:31 4107 2

原创图像分割 | 人体实例分割数据

图像分割（image segmentation）技术是计算机视觉领域的一个重要的研究方向，是图像语义理解的重要一环。图像分割是指将图像分成若干具有相似性质的区域的过程。该技术相关的场景物体分割、人脸人体Parsing、人体前背景分割、三维重建等技术被广泛应用于无人驾驶、手机应用、增强现实、安防监控等领域。AI技术的三个要素：算法、数据和应用场景，数据是非常重要的。算法会快速的迭代更新，但是数据的...

2020-02-28 19:01:58 5223

原创 3D点云标注工具

日前，美团“无人配送防疫助力计划”而启用的无人配送车也宣布在北京市顺义、海淀等地投放，实现“无接触配送”。图片来自于网络无人驾驶技术的快速发展，使得无人配送车、无人消毒车等搭载着该技术的各类自主机器人冲上了抗疫前线，建起一道安全、无接触的防护壁垒。无人驾驶技术的实现在无人驾驶技术中，环境感知系统充当无人驾驶车的“眼睛”，主要是通过无人驾驶汽车所装载的外部传感器获取外部环境信息，对其进行建模...

2020-02-27 18:45:28 12014

转载如何有效的获得高质量的大规模标注数据？

本文为亚利桑那州立大学在读计算机博士生周耀的2018年独家投稿，他给大家介绍了一个基于机器教学为基础的自适应交互型众包教学框架——JEDI ，它假设每个 learner 都有指数型的记忆遗忘曲线，并且能够保证教学的有效性，多样性，以及教学样本的质量。作者的原论文（http://cn.arxiv.org/abs/1804.06481）入选了2018的 KDD 会议。以下为投稿全文。在很多机器学习的...

2020-02-25 16:18:41 1372

翻译最大规模开源说话人识别语料集——VoxCeleb

文章题目：VoxCeleb: a large-scale speaker identification datasetVoxCeleb2: Deep Speaker Recognition文章地址：http://www.robots.ox.ac.uk/~vgg/publications/2017/Nagrani17/nagrani17.pdf http://www.robots.ox.ac...

2020-02-21 20:07:31 11152 6

原创说话人识别声纹语音数据库CN-Celeb

分享：CN-Celeb 是由清华大学语音和语言技术中心（CSLT）近日公布的一个中国明星声纹库。该声纹库包含1,000名中国明星（包括歌星、影星、说唱艺人等）在采访、歌舞及影视作品中的声音片段。每位明星的声音时长大约20分钟，整个数据集近300小时。该数据包含了11类实际场景，覆盖了噪音、信道、发音方式等各方面的复杂性，特别适合研究复杂场景下的说话人识别技术。研究者可在共享资源网站 http:/...

2020-02-20 19:38:05 3278

原创如何提高语音识别模型的准确率？

“智能客服+人工坐席”的新型客户服务模式，通过自动化的语音识别技术，降低客服中心的人力成本，提升客服中心的运营效率。应用场景：客服质检、机器人外呼、语音导航智能客服和领域非常相关，不同领域的话题各不相同，还有大量的领域词汇，所以需要根据不同领域来训练相应的语音识别模型。客服语音识别的技术挑战：1、有些客户普通话口音重：不同地域有不同的口音特点2、自然风格说话：语速快、吐字不清、抢话叠字...

2020-02-18 16:43:13 4002 1

原创如何解决TTS个性化场景数据？

个性化TTS应用智能交互、自动客服、虚拟主持人个性化TTS数据如何解决？专业TTS数据制作为产品塑造独特声音形象：根据产品特点筛选符合音色的声优，高标准录制数十小时音库数据采集：中文、英文、中英混杂数据标注：发音校对、音素转写、音素边界切分、韵律标注、词性标注、重音标注、发音词典制作案例：美式英语TTS数据制作发音人：美国女声数据量：2万句，20小时录音环境：专业录音室，专业麦...

2020-02-14 18:10:50 929

原创基于端到端的语音处理的PPT

分享：在 interspeech上，ESPnet的作者们分享了**一篇基于端到端的语音处理的PPT，**这篇PPT内容包含了ASR,TTS,NLU,MT等，题目为《Advanced Methods for Neural End-to-End Speech Processing》在这篇PPT中，作者们把所有遇到的问题都通过ESPnet来完成，并且提供了大量的案例研究和实践教程，作者们希望通过这篇...

2020-02-12 18:07:05 614

转载语音切割，个人VAD系统（google 2019 论文译文）-整理

发现了一篇不错的内容~语音切割，个人VAD系统（google 2019 论文译文）：整理在：https://www.datatang.com/news/info/laboratory/273也是转载：CSDN博客陶瑞同学，不同的是已经整理成了PDF文件，方便保存，不懂怎么上传文件，想要文件的朋友留言吧~...

2020-02-12 14:14:43 510

原创人脸活体检测数据

人脸活体检测丨丰巢“刷脸取件”被小学生破解背后的秘密前些日，#小学生发现刷脸取件bug#的话题引发关注！浙江嘉兴上外秀洲外国语学校402班科学小队向媒体爆料：他们在一次课外科学实验中发现，只要用一张打印照片就能代替真人刷脸，骗过小区里的丰巢智能柜，最终取出父母们的货件。一张打印的照片，就可以骗过快递柜的人脸识别系统，丰巢的人脸识别取件技术备受质疑。对此，@丰巢智能柜官方微博进行回应，表示...

2020-02-11 18:55:33 1316 1

原创智能驾驶数据集合集

智能驾驶，加速驶进未来新世界据麦肯锡统计，至2030年智能驾驶市场将超过5000亿美元。在智能驾驶行业，根据应用场景的不同，目前较热门的领域主要集中在驾驶与泊车。智能驾驶技术真正做到商业化落地，需要不断提高智能驾驶算法的安全性。智能驾驶图像数据No.1103,300张驾驶员行为标注数据【驾驶员行为标注数据】总数据量103,300张，车内摄像头拍摄，且采集多年龄段、多时段、多种驾驶行为...

2020-02-11 18:52:24 5869 10

原创智能抗疫 | 戴口罩人脸数据助力科技防疫

新冠肺炎疫情防控牵动着国人的心，同时也是中国科技实力的一次临场考验。“提升科技防控疫情力度，积极为打赢疫情防控阻击战作出贡献。”1月29日，国资委主任郝鹏表示。帮助安检及医护人员提高疫情检测与防护效率，是筑起疫情防控的“第一道防线”。（国资委疫情工作领导小组深入企业进行专题调研）国内人工智能前沿企业及互联网企业积极发挥领军作用，正在把 AI 技术投入到新型冠状病毒疫情防控中。依图“医疗机器...

2020-02-10 14:29:41 1731

原创 2019年人工智能产业发展调研报告

2019年人工智能产业发展调研报告人工智能（AI）起源于上世纪50年代，在此后的半个多世纪中，历经了“逻辑推理”、“知识工程”的两起两落。目前，随着智能算力与数据瓶颈得以解决，在AlphaGo战胜围棋世界冠军的震撼中，“人工智能+”逐渐与各行业深度融合、走向繁荣。从全球产业发展来看，人工智能是第四次科技革命的主要技术之一，也是全球竞争的主战场，关系着国家发展前途和命运。历史上每一次科技革命，通...

2019-11-14 17:25:41 4073

原创智能垃圾识别训练数据

智能垃圾分类技术将会是人工智能在分类领域的一个重要的研究方向，一般的图像识别都会基于样本的特征进行分类，而这种样本在某些特征上相似，细节不一样。比如特定目标的人脸识别，就可以根据五官的相对距离来判断目标是否匹配。同样的，垃圾分类数据采集不仅需要大量的样本支持，还需要精确地分类以及多样性的采集方式，即多角度、多背景的复杂样本数据采集。数据堂最新自制数据推荐：72000张生活垃圾采集数据7200...

2019-08-01 15:23:29 6365 3

原创城市精细化治理过程中的智能图像识别如何更精准、更智能？

数据堂为解决城市精细化治理任务的任务需求和难点，以提供更精准、更高质的成品数据集

2023-04-04 14:05:21 531 1

原创国家知识产权局战略规划司赴数据堂调研数据知识产权工作

葛树充分肯定数据堂在探索数据要素赋能数字经济发展中所取得的成绩以及在企业数据规则构建中发挥的重要作用。他指出，数据要素是数字经济发展的基础性资源，亟需构建数据基础制度体系，补齐数据要素协同治理制度短板。他希望数据堂利用其行业经验和数据资源优势，与国家知识产权局保持协同沟通，共同推进数据知识产权相关制度体系的研究与构建工作。齐红威介绍了数据堂数据业务发展及运营情况现状，详细说明了公司对数据相关权益的保护情况，并结合公司实际提出了数据知识产权保护相关需求。

2023-03-17 17:49:40 257

原创 ChatGPT爆火的背后，到底是什么在跟我们对话？

涵盖出行、乘车、乘飞机、叫车、租车、行程购票、订机票、改签机票、订火车票、改签火车票、订宾馆、看电影、查询电影、定电影票、看综艺、看演唱会、查询地点位置、联系、打电话、发消息、寄快递、取快递、查询快递、充话费、充流量、开会、送人、接人、订餐馆、吃美食、看动漫等60个领域的意图标注数据。ChatGPT像人一样的对话过程是最大的亮点，背后的对话语义技术功不可没。规模：涵盖电话、导航、翻译、附属意图、闹钟、拍照、日程、设置、视频、提醒、天气、信息、页面控制、音乐、应用、语音助手等16个领域的意图标注数据。

2023-03-17 17:31:42 4630

原创数据推介⎮情感语音合成音库

说话人相关即保持目标说话人的音色，情感相关即捕捉源说话人的情感表达，因此需要多人多情感和多人无情感的数据来共同训练。涵盖新闻、日常口语、有声读物、诗词、广告、消息播送、娱乐等类别，语种涵盖中文、英文、中英混读，发音人男女各50人，涵盖儿童、成人、老人的不同年龄段，每人录制600到700个句子。作为全球领先的人工智能的数据服务商，数据堂可以为客户提供丰富的情感语音数据，通过这些数据训练的人工智能，合成在情感和表达上更加丰富的语音，让合成的声音更加自然真实，更好的应用在不同的场景。

2023-03-10 18:10:55 1493

原创【ECCV 2022】76小时动捕，最大规模数字人多模态数据集开源

由于数据量，数据标注的缺乏和数据质量的限制，现有的算法很难生成个性化，高手部质量，情感相关，动作 - 语义相关的动作。在 BEAT 数据集中，对于动作给出了基于动作类别分类的相关度分数，共分为四类 10 档：beat（1），deictic （2-4）， icnoic（5-7），metaphoic（8-10）。BEAT 包含四种语言的数据：英语，中文，西班牙语，日语，数据量分别为 60，12，2，2 小时。其中中文，西班牙语，日语的演讲者也同时录制了英语数据，用于分析不同语言下的动作差异。

2023-03-10 18:00:35 869

原创数据推荐 | 人体行为识别数据集

该数据集在采集过程中首先进行采集场景搭建，在场地周围环形布置了12个采集摄像头（每30度一个摄像头，保证同一行为可获取多视角数据），被采集者按要求采集安防监控场景下通常出现的人体行为，包括站立、蹲下、走路、打招呼我、握手、打电话、抽烟、徘徊、跌倒、蹲下护头等。动态行为：对于动态行为，还需增加视频抽帧模块，对动态人体行为视频基于特定的采样率抽取图像帧，然后对图像帧标注人体关键点信息，对动态行为视频整体标注人体行为种类标签标注。静态行为：直接对图像中的目标人体进行关键点标注，并对整体行为种类做标签标注。

2023-03-03 19:28:13 2956 1

原创喜报 | 数据堂荣获2022高成长企业Top100

在创新能力方面，数据堂为智能化产业升级提供一站式安全数据服务，拥有国内首创“基于Human-in-the–loop”人机交互半自动标注与质检功能的人工智能数据标注平台，能提供准确率99%及以上数据集的高效生产，相对于传统方式平均提高效率30-40%。在科技实力方面，数据堂依靠十多年的数据处理经验，积累了丰富且高质量的成品数据集，现有成品语音数据20万小时，图像数据800TB以及文本数据20亿条。数据集均已获得采集授权，版权清晰可靠，帮助客户快速节省60%的数据采集成本以及100%的时间。

2023-03-03 19:18:07 187

原创多语种平行语料数据，助力“一带一路”深入交流

沉淀十余年数据处理经验的数据堂，积累了自己在语言资料库方面独特的数据优势，覆盖医疗、外贸、体育、金融、能源、计算机、法律等专业领域，提供各类句子级的双语对齐语料，可以帮助各翻译系统实现中、英、日、韩、法、俄、维等不同语种之间的互译。随着近年人工智能和自然语言处理技术的快速发展，机器翻译技术与人工翻译水平的差距不断拉近，机器翻译被看作是突破语言障碍的“金钥匙”，将在“一带一路”经济、政治、外交、文化交流等方面起到越来越重要的作用。数据堂有几十个语种的大规模、高质量的平行语料数据，涵盖书面语、口语等多种类别。

2023-02-24 18:04:39 258

原创首个声纹识别数据安全要求国家标准发布！数据堂参与起草制定

结合我国大数据产业与实体经济深度融合、产业发展不断壮大，数据作为生产要素的属性不断凸显的大背景，在人工智能领域，要实现数据要素的价值转化，专业的AI数据服务商将在释放数据价值中起到越来越重要的作用，有效激发数据要素创新活力，加速数字产业化和产业数字化进程。该标准规定了声纹识别数据的收集、存储、使用、加工、传输、提供、公开、删除等数据处理活动的安全要求，适用于声纹识别数据处理者规范数据处理活动，也可为监管部门、第三方评估机构对声纹识别数据处理活动进行监督、管理、评估提供参考。实施日期为2023年5月1日。

2023-02-24 17:36:52 234

空空如也

快速掌握LLMs炼金术，必读Prompt Engineering实践技巧