![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大模型语料数据联盟
文章平均质量分 77
OpenDataLab
坚持战略性、前瞻性、开放性、公益性的科研理念,践行共享数据资源的推广,打造国际领先的AI数据平台
展开
-
高质量新闻数据集OpenNewsArchive:880万篇主流新闻报道,国产大模型开源数据又添猛料
在构建国产大语言模型的道路上,高质量新闻是不可或缺的重要语料之一。这类语料集。原创 2024-05-15 17:43:07 · 1596 阅读 · 0 评论 -
首场“解数Talk” 直播来了——大模型语料数据联盟开源数据集解读
为帮助广大开发者更好地了解大模型语料数据联盟发布的AI大模型语料数据,沟通大模型企业在AI视角下的数据需求,不断服务大模型产业生态和落地应用,联盟发起单位上海人工智能实验室联合成员单位共同打造。的专家,为大家深度解读一下已开源发布的两个高质量数据集“蜜巢·花粉1.0”和“国际仲裁法律、规则与实践数据集”。联盟旨在通过链接模型训练、数据供给、学术研究、第三方服务等多方面机构,共同推动高水平语料数据要素建设。目前,联盟已开展“寻数计划”、联盟开放日等活动,同成员单位一起在大模型语料数据领域深度开展交流合作。原创 2023-12-13 12:53:43 · 228 阅读 · 0 评论