- 博客(82)
- 收藏
- 关注
原创 数据开源 | Magic Data大模型高质量十万轮对话数据集
能够自然的与人类进行聊天交谈,是现今的大语言模型 (LLM) 区别于传统语言模型的重要能力之一,近日OpenAI推出的GPT-4o给我们展示了这样的可能性。对话于人类来说是与生俱来的,但构建具备对话能力的大模型是一项不小的挑战,收集高质量的多轮对话训练数据则是其中关键一环。本数据集由晴数智慧Magic Data制作,总量轮次。都做到了极高品质,得到国内外大模型客户的认可。
2024-07-10 13:54:14 1232
原创 数据开源 | Magic Data开源基于ChatGPT的可扩展的对话数据集
在过去的一月里,人工智能领域中最火的话题莫过"ChatGPT"
2022-12-23 10:30:48 6510 1
原创 数据开源 | Magic Data中英文座舱功能点泛化语料
Magic Data新开源NLP数据1000+,该数据为中英文座舱功能点泛化语料,欢迎下载。
2022-11-10 18:15:06 1274
原创 挑战赛结果公布 | ISCSLP2024 对话语音克隆挑战赛(CoVoC)
2024年6月,由晴数智慧(Magic Data)联合西北工业大学音频语音与语言处理研究组(ASLP@NPU)、新加坡资讯通讯研究院(I2R)、深圳大数据研究院(SRIBD)、香港中文大学(深圳)等多家单位在2024年中文口语语言处理国际会议(ISCSLP2024)上推出了对话语音克隆挑战赛(Conversational Voice Clone Challenge — CoVoC)。
2024-07-17 10:57:26 1030
原创 开源数据 | 语音对话大模型高品质数据集——MagicHub多方言语音数据集推荐
近日,法国知名开源AI研究实验室Kyutai推出了一款具备看、听、说多模态大模型——Moshi。Moshi功能与GPT-4o相似,可以听取人的语音提问后进行实时推理回答内容。然而,Moshi最吸引人的是全面开源,并可以支持在端侧运行。这将大大提振语音对话模型在端侧的普及。Moshi作为一个端到端的多模态模型,不仅在语音处理上有所突破,更重要的是它让我们看到了不一样的人机交互方式。近期国内的从业者也开始下载Moshi并试用。考虑到Moshi目前对普通话支持较差,我们很期待国内产品优化对普通话的支持。
2024-07-09 16:23:22 1301
原创 报名进行中 | ISCSLP2024 对话语音克隆挑战赛(CoVoC)
晴数智慧(Magic Data)联合西北工业大学音频语音与语言处理研究组(ASLP@NPU)、新加坡资讯通讯研究院(I2R)、深圳大数据研究院(SRIBD)、香港中文大学(深圳)等多家单位在2024年中文口语语言处理国际会议(ISCSLP2024)上推出对话语音克隆挑战赛,在开源1万小时的WenetSpeech4TTS数据集和180小时的普通话自然对话语音数据的基础上,参加赛事将获得100小时的高质量对话数据。快来报名参赛吧!
2024-06-14 18:04:02 1510
原创 数据分享|纯净音自然多轮对话数据集——语音大模型
语音大模型构建需要大量的自然数据,尽可能保证自然度,内容多样性,以及口音多样性。此数据集采集自来自中国30个省份的说话人,地域分布均衡,涵盖18-60岁的说话人,囊括了普遍的说话风格与特点;此数据集含有说话人在多种状态下的自发对话,包括商务工作、购物咨询、争议协商、闲聊等状态,帮助机器学习及掌握人类在多种对话状态下的发音特征和风格从而实现更好地拟合。晴数智慧高纯净音自然多轮对话数据集处理过程遵循完整的晴数智慧数据合规保障机制,在整个数据生命周期中,保证数据的流转可溯性,确保数据版权完整。
2024-01-12 16:33:45 748
原创 勇立潮头!高品质SFT语音数据实现Zero-Shot语音复刻大模型
为了实现高效合成既自然又高质量的人类语音,有不少机构及企业都进行了相关项目的研究,包括微软亚洲研究院机器学习组和微软 Azure 语音团队去年推出的NaturalSpeech(https://speechresearch.github.io/naturalspeech2/)还有Meta今年发布的Voicebox(https://voicebox.metademolab.com/),都是利用大数据、大模型和零样本(zero-shot)合成技术,实现语音合成的音色、韵律、风格的多样性的代表。
2023-09-22 14:10:52 758
原创 巴别塔再现?高质量端到端数据助力Meta推出AI模型SeamlessM4T
Meta推出AI模型SeamlessM4T,该模型可翻译和转录近百种语言,似乎将破除因语言不同而导致的沟通障碍。可谓是人类构建“巴别塔”的又一次尝试。
2023-08-25 18:28:33 399
原创 案例|智慧金融:借助AI训练数据打造全新数字员工
彭博近日发布了金融领域大语言模型:BloombergGPT,500 亿参数语言模型(*)。数字化、智能化转型正在各行各业全面铺开,人工智能等技术加速向金融业渗透,保险从业机构保持技术的敏感度,持续提升创新能力,不断挖掘增量市场,以应对科技发展带来的挑战和机遇。Magic Data作为领先的AI数据解决方案提供商,深耕对话式人工智能领域,期待能在未来持续为行业客户提供数据侧支持,从数据科学的专业视角赋能客户的数智化转型。
2023-03-31 16:47:53 661
原创 张晴晴:对话数据推动AIGC——大模型底层数据探索
“Training data is technology” .数据即科技,OpenAI的联合创始人Ilya Sutskever在与知名科技媒体The Verge访谈中提到。ChatGPT自发布以来热度席卷全球,一周前惊艳亮相的GPT-4更是让人感叹我们迎来了AI发展的历史性时刻。然而我们也困惑,OpenAI为何不开源GPT-4?在我们看来,更多的奥秘或许存在于数据之中......
2023-03-24 15:19:09 2159
原创 MagicThoughts|让ChatGPT变得更智能的Finetuned数据集
现有的ChatGPT,除了稳定性有待提高、内容准确度有待提升外,想要做到垂直领域商业应用的“定制化”,还是一件很难的事。
2023-02-14 09:52:09 5097
原创 行业洞察|猴子可以打字,动物走进元宇宙还有多远?
人类思维可以导入元宇宙,同时动物也可以参与到元宇宙中,元宇宙才能真实的还原人类社会,才能是我们生活的另一个逼真的平行世界。
2023-01-09 15:19:14 605
原创 功能上新 | Magic Data Annotator智能出行舱内舱外全场景标注
智能驾驶已经成为目前车企营销的核心竞争力,在人车协作过程中,智能汽车最重要的功能就是车舱内外视觉功能,该功能就如同人类的眼睛一般重要。
2022-11-18 17:18:01 588
原创 行业洞察 | OCR文字识别技术都有哪些用途
现在连一支笔也卷起来了,配备文字识别OCR(Optical Character Recognition)摄像头。近年来文字识别也几乎成为了无处不在的便利小帮手。
2022-11-10 17:45:40 2021
原创 行业洞察 | 你的语音小助手的词汇量够吗?
对答如流的语音助手,到底有多少词汇量?是否和人类一样需要从ABC开始积累呢?答案是,他们并不需要逐步积累。
2022-10-27 17:18:05 973
原创 技术分享 | 自动驾驶的春晚—Tesla AI Day
硬核拆解特斯拉Full Self-Driving Computer (FSD) 创新的底层技术。
2022-10-27 17:03:39 1591
原创 技术分享 | 语音AI如何驱动虚拟人
AI语音驱动虚拟数字人作为虚拟人落地的核心技术,不仅大幅节省了制作成本,同时精细化的培养了虚拟数字人口手合一的协调性。
2022-10-20 21:11:57 5943
原创 行业洞察 | 文本生成视频,Meta、Google哪家更胜一筹?
近期,Meta和Google在文本生成图片的基础上更进一步,相继推出文本、语音生成视频的黑科技。
2022-10-13 18:27:00 2130
原创 技术解析 | 特斯拉为什么押注人形机器人“擎天柱”?
在9月30日的特斯拉 2022 AI Day上,马斯克终于揭下Tesla Bot的神秘面纱。
2022-10-13 17:34:29 933
原创 挑战赛 | ISCSLP2022中英混语音识别挑战赛成绩发布
9月23日,组委会正式公布“ ISCSLP2022中英混语音识别挑战赛”成绩排名。
2022-09-23 18:18:27 1294
原创 行业洞察 | 脑机接口,下一代智能机器人的风口?
脑机接口在各个领域的应用,都是真正有思维的智能机器人实现的基石,当这些基石铺垫的足够高的时候,也许一个庞大的具有意识的智能机器人就诞生了。
2022-09-23 17:50:04 754
原创 挑战赛 | ISCSLP2022对话短语音说话人日志挑战赛决出三甲
9月16日,组委会正式公布「ISCSLP2022对话短语音说话人日志挑战赛」成绩排名。
2022-09-16 16:43:28 830
原创 白玉兰开源携手30+家学界业内先锋,发布《中国人工智能软件基础设施高质量发展报告》
在2022世界人工智能大会上,白玉兰开源携手Magic Data等30+家学界业内先锋,发布《中国人工智能软件基础设施高质量发展报告》。
2022-09-08 18:28:36 669
原创 挑战赛 | MagicHub中英混语音识别挑战赛发布基线系统和开发训练集
8月24日,MagicHub中英混语音识别挑战赛发布基线系统和开发训练集。
2022-08-24 17:22:51 946
原创 行业洞察 | 小米发布人形机器人的AI技术
全尺寸仿生人形机器人CyberOne,其听觉传感器配合音频算法,可识别6类45种人类情绪语音,外加85种环境音识别。
2022-08-14 20:01:04 1071
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人