国际计算语言学协会北美分会2022年度会议(NAACL2022)将于2022年7月10日至15日在美国西雅图召开,线上会议入口同步开放。NAACL是自然语言处理国际顶级学术会议,预计今年将吸引超1500名相关领域研究人员及从业者参会。Magic Data非常荣幸作为本次会议的赞助商出席会议。
同时作为本次会议参展商,Magic Data将在会上带来最新的AI训练数据全套方案,同时分享Magic Data研发中心的最新研究成果。Magic Data研发中心在其进行的三组使用了法语训练数据的ASR模型训练中发现,对话场景下:
1. 使用MD对话式数据训练的ASR模型词错误率比使用开源朗读数据训练的降低40%;
2. 使用对话式训练数据的ASR模型词错误率比使用朗读训练数据更低,对话式数据更贴合真实场景。
欢迎届时前往 13号展台 或联系open@magicdatatech.com咨询数据详情
成立5年来,Magic Data为人工智能领域研发企业和科研机构提供数据处理工具、AI数据集和采标服务三大核心产品,产品涵盖智慧出行、智慧金融、智能社交、智能家居、智能终端等五大行业,迄今服务了微软、高通、英伟达、阿里巴巴、百度、腾讯等国内外近200家合作伙伴。截至目前,Magic Data有超过400个高质量合规可授权数据集产品,其中包括超20万小时的语音数据和超3百万条的文本数据,可快速用于ASR、NLP、TTS等模型训练。