自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 海天瑞声:助力AI企业打造“方言天才”

智能应用领域,任何地区的重口音、方言用户都可以普通话混合方言随意说出指令,不会因为口音问题出现听不懂、会错意的问题,即使是只会讲方言的老年人,也可以跟家里智能产品对话,实现无障碍交流,享受到科技带来的美好;如何能够让两个跨方言语种的人,实现语言的相通?随着,智能助手、智能搜索、智能导航、智能音箱等AI语音应用或产品,对于标准普通话的识别精准度越来越高,而对于方言,尤其是面对带有地方重口音的方言,识别精准度远不及标准普通话,且方言语种覆盖范围有限。方言,是语言的变体,根据性质,方言可分地域方言和社会方言。

2023-08-02 12:48:07 136

原创 海天瑞声:做“AI+教育”的助跑者

人工智能技术的支持下,实时捕获和识别学习者的课堂行为数据(动作、语言等)、心理数据(情绪、人格)、生理数据(血压、脑电波等)等多模态数据,可以更加全面、准确地反映学生的认知提升、高阶思维发展等情况,精准预测和干预学生学习状态。对此,教育专家表示,AI不是填报志愿的神器,只能作为参考的工具。基于在教育领域的AI数据服务经验,海天瑞声在推动AI与学生学习、教师发展、学校建设、教育管理、教育评价、个性化教育公平等融合层面,和业内企业一起,助力教育智能化系统建设,促进教育高质量发展。

2023-08-02 12:46:26 110

原创 海天瑞声:助力AI企业出海,破解小语种密码

数据紧跟前瞻AI应用场景”——对于“应用场景复杂多样”的海外市场需求,海天瑞声凭借多年全球化项目经验,对市场前沿需求时刻保持敏锐,数据集支持语音识别、语音合成、计算机视觉、自然语言处理、词典等多个任务领域,覆盖智能家居、智能驾驶、虚拟主播、有声书、智慧金融、智能安防、智能搜索等多个业务场景,为AI企业及应用出海开启更多赛道与可能。藏/维/蒙语OCR数据库,每种语言包含1000张图片,涵盖日常生活各类场景,如自然场景(路牌,宣传栏,店铺名,菜单,海报等)、文档翻拍(书籍,报刊,A4纸文档);

2023-07-26 16:32:20 133

原创 如何提高手机语音助手识别的精准性

从最初的识别简单的10个英文数字到今天各种语 音识别软件的开发,多平台的技术运用,加上深度神经网络技术和大数据的结合,语音识别的精准度己有大幅提升,同时在智能机器人 、 智能家居等领域有较大的应用需求。数据收集与标注困难:为了训练有效的多语种识别模型,需要大量且高质量的双语或多语言数据。目前,各大手机品牌都已配备了各自的语音识别助手,但当我们在日程生活中使用这些语音助手的时候,都会面临一个尴尬的状况,就是语音助手不能正确识别我们的指令需求,“你问它东,经常给你答西”,令人哭笑不得。

2023-07-19 11:24:55 274

原创 AI如何推动工业制造向“智造”升级?

尤其在工业制造领域,“AI+制造”正在给工业制造带来革命性的变化,同时带来更多的市场想象空间,让我们基于如下细分应用场景领域,透视AI驱动之下的工业制造转型升级,以及为企业生产和管理带来的全新变革。通过AI技术与自动化设备及产线无缝融合,半导体制造行业的智能液晶面板生产,实现芯片绑定、屏幕贴胶、边缘检测、包装等生产流程全自动化,并基于AI技术建立了完整的监控系统,助推生产线实现自动化。对于很多工业制造领域,一旦生产流水线出现故障,将影响整个生产过程,带来难以挽回的“灾难”。技术赋能工艺制造,高质高效作业。

2023-07-12 13:38:13 141 1

原创 海天瑞声助力自动驾驶技术升级,推动产业创新发展

在市场需求、技术发展等多方面的支持下,国内的自动驾驶正散发着盎然生机,也衍生出了像海天瑞声这一类与一体化数据处理平台相配合,建立了全时日志库及终端人管理系统,实现平台内操作留痕、透明可追溯和平台内不同角色的严格权限分级的在人工智能领域深耕多年的数据解决方案服务供应商,有这类公司的支持,国内自动驾驶解决方案不断突围,本土企业技术积累和场景化算法 优势逐渐显现,中国自动驾驶行业将日益走近国际舞台中心,在国际上拥有更多行业话语权。从数据维度来看,可以分成三层,获取数据的能力、加工数据的能力、闭环数据的能力。

2023-07-12 13:35:55 420 1

原创 借力算法,海天瑞声驾驭自动驾驶“新引擎”

此时,海天瑞声作为综合数据服务商的显著优势就凸显出来:总的说来,行业现阶段训练数据采集标注的定制化需求较多,海天瑞声在基础研究上的多年积累,使得其能够更好把握现有技术方向,深入了解客户对训练数据的运用逻辑和需求痛点,保证客户算法取得尽可能好的落地效果。其十多项核心技术应用于训练数据生产的设计、采集、加工、质检中,自主研发一体化数据处理平台,将项目流程管理、质量把控、数据安全管理融入其中,并嵌入上千款自主开发积累的,适用于各种业务场景训练数据处理需求的工具,充分提高了数据训练的生产效率与质量控制水平。

2023-07-05 19:00:12 333

原创 在这个“刷脸”的时代,如何捍卫你的脸?!

与2D图像的RGB信息相比,3D人脸数据多了一个维度—深度信息,即RGBD,RGBD图像的获取不仅意味着更加专业设备的支持,更意味着复杂且极高难度的后续处理,比如数据的噪声滤波、去除散列点、孤立点,保证RGB数据与深度数据在时间上、空间上的对齐,还需要将多个角度的图片数据整理、配准、合并成一个完整的3D数据,即3D重建。与此同时,是频繁爆出的安全隐患问题:照片打印人脸虽然已是过去式,但某些场景下,视频回放、3D人脸面具依然可以轻松骗过镜头,做到用一张脸刷另一个人的账户,开另一个人的车,进另一个人的家…

2023-07-05 18:24:02 50

原创 企业如何赢取“AI数字人”先机?

目前AI数字人市场差异化竞争趋势明显,入局企业大都基于自身技术优势以及客户群体覆盖的领域进行研发创新,相对应地,包括企业当前的产品基本功能、AI能力、市场及生态能力、商业化能力、用户体验以及未来发展愿景,都会影响其AI数字人产品及应用的发展走向。数字人已经覆盖到广泛的应用场景,例如北京冬奥会新闻播报数字人、 百度智能云AI手语主播、腾讯3D手语数智人“聆语”、AI气象服务虚拟人“冯小殊”、美妆达人柳夜熙、虚拟学生华智冰、数字航天员小诤等等,让大众对于数字人有了更加直观的认知。人才供应体系不够完善。

2023-06-28 11:36:49 66 1

原创 海天瑞声多模态数据解决方案,让数字人真正“活”起来

对此,海天瑞声的解决思路是自研多通道采集工具和数据同步技术,多通道采集工具支持4路甚至更多语音数据同时录入、自动对齐整合,数据同步技术可实现多通道采集原料数据的自动对齐,并做到多音频文件起始点自动对齐误差小于1毫秒,大幅提升训练数据生产效率和质量。尤其是多模态技术爆发以来,相应的对多模态数据需求的增长,逐步暴露了“作坊式”数据采标团队“人海”战术的短板,整个数据市场正向满足客户长尾需求演进,对服务商技术属性的要求一再加码。随着AI应用逐渐普及,位于基础设施层的AI数据服务行业正发展地风生水起。

2023-06-20 19:06:51 218

原创 DOTS-AD标注平台助力高精度地图标注领域突破

DOTS-AD自动驾驶标注平台 经过内部数亿帧数据的项目打磨,可支持万人同时作业,能够解决项目经理和标注员的使用痛点,提升标注效能,且支持多元化的部署方式。同时,DOTS-AD自动驾驶标注平台还可以进行多样化的数据格式支持,能够处理多种数据格式,包括图像、点云、视频、声音等,以满足不同类型数据的标注需求。『DOTS-AD自动驾驶标注平台』提供便捷的数据管理和协作功能,可以实现多人协同作业,团队成员可以同时进行标注工作,并及时反馈和校对标注结果,确保标注工作的一致性和效率。数据标注效率提升高达8倍。

2023-06-20 19:00:28 235

原创 3D数据将为深度学习带来更广阔的想象空间

其次,即使通过项目经验丰富的人员和专业的设备采集到了符合要求的3D数据,在数据处理阶段,3D也远比2D的标注复杂的多。海天瑞声早在5年前,就开始引入用于人体扫描、动作捕捉、空间扫描等诸多场景的3D数据采集设备,为用户的3D物体检测及追踪、3D形状分类等项目提供数据支持,也积累了丰富的项目经验;随着大规模标注数据的发展,近年来深度学习技术在语音、语言、图像等领域都取得了长足的进步,尤其是在计算机视觉领域,海量的2D图像数据极大地提高了深度学习模型的性能,使其在多个场景成功落地。3D人体数据标注示例。

2023-06-14 15:06:27 80

原创 数安智库|海天瑞声数据保护官李科分享AI训练数据安全管理实践

AI数据企业通过训练数据(集)的设计、采集、加工处理、质检等生产环节,生产、形成优质的标准化数据产品或数据服务成果,用于AI算法和模型训练,为AI技术和AI产业的发展助力。(二)数据标注环节:技术措施和管理措施相结合数据标注环节涉及大量数据的处理,这些数据可能是AI数据企业自采数据,也可能是AI技术、AI应用企业等客户委托AI数据企业处理的数据,并很可能具有创新性强、保密性高、商业价值大的特点,这对处理数据的AI数据企业的安全和保密水平提出了更高要求。现任海天瑞声数据保护官,领导公司数据安全工作。

2023-06-14 14:54:03 376

原创 海天瑞声开源多模态数据集,解决多模态模型准确性问题

海天瑞声近期开放共享多模态数据集,此次开源的多模态数据集「DOTS-MM-0526」涵盖图像、语音、文本等多个维度。海天瑞声希冀与全球AI开发者和研究人员建立更加紧密的合作关系,共同推动人工智能技术的发展和应用。

2023-06-07 11:20:08 309 1

原创 海天瑞声|从数据看AI赋能下的智慧金融场景

得益于丰富的场景经验及包含12项核心技术、134项计算机软件著作权、24项专利的领先技术水平,海天瑞声自主研发了针对不同场景数据的处理工具,包含用于身份识别的人脸多点位标注工具、针对复杂OCR场景的标注处理工具、2D、3D融合标注工具、多模态数据处理工具等,并在多年的服务过程中建立了从方案设计、数据采集标注到质量检验的高效服务流程体系。供应链金融中作为重要主体之一的中小微企业,数据采集难度大、交易行为复杂,这就导致训练数据的匮乏,从而加剧了相应算法模型训练的难度,也成为商业落地的重要瓶颈。

2023-05-31 10:22:18 129 1

原创 教会AI“读唇术”,唇语数据功不可没

近些年,国外的唇语识别技术已经相对比较成熟,但是鉴于人种的生物特征以及语言特征的不同,想要发展国内的唇语识别技术,就必须建立属于我们自己的唇语识别系统。一套成熟的唇语识别系统需要大量的人脸特征样本数据,这些数据要尽可能包含更多场景、更多类型的说话人,以此保证训练出来的唇语识别模型具有更好的泛化能力。近几年,海云数据、搜狗等国内多家企业也相继发布唇语识别技术。随着唇语识别技术日益成熟,说不定在未来的某一天,当警察面对犯罪分子的时候,可以说出那句经典台词:“你有权保持沉默,但你嘴唇的每个动作都将成为呈堂证供!

2023-05-31 10:19:48 243

原创 火爆的多模态,模仿的对象竟然是...

海天瑞声自有知识产权数据集产品中包含多个即买即用的多模态数据产品,King-AV-028、King-AV-018等,其中King-AV-018是针对虚拟主播需求开发的视频训练数据集,包含250个中国人的唇语视频信息,采集过程将语音数据采集设备叠加针对唇语信息的视频采集设备,运用自主研发的多模态数据采集软件同时录入不同硬件设备的数据,并保持了多维度数据的对齐。此外,自主研发的短视频音频聚类技术,可针对多模态训练数据集执行数据关联性、重复性检测,有效地保证了多模态数据集的质量;

2023-05-24 17:50:47 82

原创 智能语音产品出海印度秘密武器

当然,如果以上数据不能满足当前的需求,我们还可以针对特定人群、特定场景、特定语种进行定制化服务,在过去10多年里,海天瑞声积累了丰富的项目经验,并可以在多个国家/地区进行本地化项目实施,尽最大努力帮助客户得到满意的算法优化结果。在印度市场,除了要面对不同文化、宗教信仰等意识形态层面的碰撞,最难以克服的应属当地错综复杂的语言问题,由于印度民族众多、历史悠久,共有多达1652种语言和方言。庞大的市场需求,加上印度自身的技术优势以及人才储备,都为中国科技企业在印度的发展提供了有利因素。古吉拉特语:6,000万。

2023-05-24 17:48:03 76 1

原创 借力算法,海天瑞声驾驭自动驾驶“新引擎”

此时,海天瑞声作为综合数据服务商的显著优势就凸显出来:总的说来,行业现阶段训练数据采集标注的定制化需求较多,海天瑞声在基础研究上的多年积累,使得其能够更好把握现有技术方向,深入了解客户对训练数据的运用逻辑和需求痛点,保证客户算法取得尽可能好的落地效果。其十多项核心技术应用于训练数据生产的设计、采集、加工、质检中,自主研发一体化数据处理平台,将项目流程管理、质量把控、数据安全管理融入其中,并嵌入上千款自主开发积累的,适用于各种业务场景训练数据处理需求的工具,充分提高了数据训练的生产效率与质量控制水平。

2023-05-17 15:15:25 272 1

原创 由海天瑞声支持,全球最大多领域英语开源数据集发布

日前,由陈果果、都家宇、张卫强等发起的语音社区志愿者组织SpeechColab和清华语音与音频技术实验室,联合语音社区的8个团队,在语音界大神Daniel Povey, Sanjeev Khudanpur, Shinji Watanabe等的大力支持下(详见下图),发布了全球最大的多领域英语开源数据集—GigaSpeech,介绍该数据集的论文已被国际语音顶会InterSpeech2021接收。作为目前全球最大的多领域英语开源数据集,GigaSpeech致力于推动学术界和产业界的共同进步。

2023-05-17 15:10:12 169

原创 海天瑞声数据标注平台如何助力自动驾驶企业实现高效数据利用?

随着技术的不断发展和普及,自动驾驶汽车已经被视为未来汽车的一个大趋势。自动驾驶汽车是指通过使用人工智能、计算机视觉和其他工具来使汽车可以自主地行驶,而无需人类的干预。这些车辆可能会带来许多好处,例如更高的速度和更好的燃油效率,更少的交通事故和对环境的更少侵害等。但是,实现自动驾驶汽车也面临一些困难,其中之一就是如何让汽车安全地在不同的路况和人行道上行驶。这就需要大量高质量和准确的训练数据。以使它们能够正确地识别不同的道路标志、交通信号、行人和其他车辆等。

2023-05-12 16:35:41 460 1

原创 赋能自动驾驶技术腾飞——海天瑞声发布『DOTS-AD』自动驾驶标注平台

自动驾驶技术的发展已经取得了巨大进步,现在越来越多的汽车制造商和科技公司都在开发自己的自动驾驶汽车。但要想汽车真正实现自动驾驶还需要面对很多挑战,其中之一就是准确性问题。这让数据标注在自动驾驶技术中显得尤为重要。

2023-05-05 12:22:32 515 1

原创 AI浪潮正来袭,大数据管理是重点

把握AI,拥抱未来要问最近什么内容刷爆朋友圈,那答案肯定是上映七天票房破20亿、吊打其他贺岁档的《流浪地球》。影片讲述了地球即将毁灭,人类将地球推行到太阳系的故事。可以说,这是中国科幻电影第一次探讨“未来”这个话题。未来会发生什么其实很难预测,但有一点可以肯定,AI当仁不让将成为未来人类社会的主角之一。AI作为发展大势可以为各企业打开一扇全新的、潜力无穷的市场大门。但同时,应用AI的项目都...

2019-02-20 19:27:16 256

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除