自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 阿里云计算巢Math-QA数据服务:革新数学应用题理解与推理能力

Math-QA数据集中包含了一系列精心设计的数学应用题,以严谨的逻辑结构和明确的操作步骤详尽展现了解决实际数学问题的过程。问题描述清晰明了,提供了完整的速度、时间和答案选项,并附有详细的解题原理和公式推导过程:“一列火车以48公里/小时的速度运行,在9秒内穿过一根电线杆。计算巢官方提供了一个钉钉群,我们可以加入到群中直接跟阿里云官方人员进行交流,他们会非常迅速的帮我们更新数据集,之前我一直想要的wiki数据跟他们反馈后几个小时就给我上架了,速度感人~泪目~钉钉群链接:链接~戳我戳我。

2024-02-20 18:23:34 305

原创 探索阿里云计算巢中的GSM8K数据集:开启小学数学智能问答新篇章

这个高质量的数据集涵盖了8500多个小学数学词汇问题,专为支持多步推理及解决基本数学问题的任务而设计,为推动人工智能在数学教育领域的应用提供了有力支撑。计算巢官方提供了一个钉钉群,我们可以加入到群中直接跟阿里云官方人员进行交流,他们会非常迅速的帮我们更新数据集,之前我一直想要的wiki数据跟他们反馈后几个小时就给我上架了,速度感人~泪目~总之,阿里云计算巢的GSM8K数据集凭借其丰富的内容和严谨的结构设计,为研究者们构建和优化能够理解并解决复杂小学数学问题的AI模型提供了宝贵的资源。

2024-02-18 10:00:26 692

原创 探索阿里云计算巢中的OpenAI HumanEval数据集:编程问题的智能化评估与解决方案

无论是提升模型理解自然语言描述并转换为有效代码的能力,还是检验模型在解决复杂编程问题上的精准度,阿里云的这项服务都能发挥关键作用,有力推动了AI编程技术的发展与应用实践。HumanEval数据集包含了164个精心设计的编程任务,每个任务都包含四个关键组成部分:task_id(样本标识符)、prompt(输入描述,包括函数头及docstring注释)、canonical_solution(问题的标准答案)以及test(用于验证生成代码正确性的测试函数和entry_point入口点)。函数是否满足预期功能。

2024-02-18 09:50:12 288

原创 探索阿里云计算巢中的MNIST手写数字数据库

计算巢官方提供了一个钉钉群,我们可以加入到群中直接跟阿里云官方人员进行交流,他们会非常迅速的帮我们更新数据集,之前我一直想要的wiki数据跟他们反馈后几个小时就给我上架了,速度感人~泪目~:同样格式的测试图像数据数组,其尺寸为10,000x784,每一行同样是展平后的测试图像像素信息,共涵盖了10,000个独立的测试用例。:这是一个大小为60,000x784的numpy数组,每一行代表着一张训练图像经展平处理后的像素值序列,共计60,000张训练图像。钉钉群链接:链接~戳我戳我。

2024-02-05 09:43:10 325 1

原创 探索阿里云计算巢CMMLU数据集:深度评测LLM对中国语言与文化的理解能力

通过阿里云计算巢CMMLU数据集,科研人员和开发者可以更加系统地评估和优化其构建的LLM在中国语境下的表现力,从而推动AI技术更好地服务于中国社会的多元化需求,并在全球视野下展现独特的竞争力。计算巢官方提供了一个钉钉群,我们可以加入到群中直接跟阿里云官方人员进行交流,他们会非常迅速的帮我们更新数据集,之前我一直想要的wiki数据跟他们反馈后几个小时就给我上架了,速度感人~泪目~更重要的是,该评测集特意设计了大量针对中国本土文化背景的问题,确保模型能够深入理解和适应中国特有的语境与文化内涵。

2024-02-04 16:13:52 295 1

原创 阿里云计算巢推出中文科学文献数据集 CSL,助力NLP研究与文本挖掘应用

该数据集涵盖了396,209篇来自国家科技资源共享服务工程技术研究中心的高质量中文核心期刊论文元信息,时间跨度自2010年至2020年,内容包括每篇论文的标题、摘要及关键词,并依据中文核心期刊目录对学科和门类进行了细致的标注,共划分为13个一级门类标签和67个二级学科标签。文本摘要任务:输入论文摘要,模型需预测对应的论文标题,例如,基于摘要“一种适用于机载InSAR系统的联合定标算法”,预测得到标题为“基于加权最优化模型的机载InSAR联合定标算法”。钉钉群链接:链接~戳我戳我。

2024-02-02 17:55:20 495

原创 阿里云流萤Firefly微调数据集:赋能高质量中文NLP模型训练与优化

计算巢官方提供了一个钉钉群,我们可以加入到群中直接跟阿里云官方人员进行交流,他们会非常迅速的帮我们更新数据集,之前我一直想要的wiki数据跟他们反馈后几个小时就给我上架了,速度感人~泪目~这款精心打造的数据集,凭借其丰富的内容、多样的任务类型以及严格的质量控制,为各类中文NLP模型提供了强大的训练支撑。综上所述,阿里云流萤Firefly微调数据集以其实用性、多样性和高质量特性,有力地推动了中文NLP领域的研究进展,为开发更为智能和高效的自然语言处理应用奠定了坚实的基础。钉钉群链接:链接~戳我戳我。

2024-02-02 17:48:46 210

原创 阿里云大数据资源——104万词条中文语料库,赋能NLP与知识问答应用

相比于其他平台,计算巢数据集对我们个人使用者来说还有一个好处,那就是可以非常方便的反馈自己想要的数据集。总之,阿里云提供的这款庞大且全面的中文语料库凭借其丰富的信息层次和广泛的主题覆盖,对于推动自然语言处理技术的发展,优化词嵌入模型性能,以及构建高效的知识问答系统具有不可估量的价值。其中,“id”代表词条的唯一标识,“url”链接至维基百科对应页面,“title”为词条标题,而“text”则包含了详细的正文内容,正文通过"\n\n"进行换行处理,确保了文本逻辑的连贯性与可读性。钉钉群链接:链接~戳我戳我。

2024-02-01 11:16:39 534 1

原创 阿里云计算巢海量优质中文问答数据集——构建智能知识库与训练模型的理想资源

这款数据集的独特之处在于其详尽的结构化信息,每个问题不仅包括“qid”、“category”(问题类型)、“title”(问题标题)和“desc”(问题描述),还附带了详细的“answer”部分,使得整个数据集既能作为训练词向量和预训练模型的基础素材,又能服务于百科类问答系统的建设。总之,阿里云计算巢发布的这一大规模多类别中文问答数据集,凭借其丰富的内容、详尽的标注以及广泛的适用性,无疑将成为广大研究者和开发者构建更智能的知识库、训练更为精准的语言模型的宝贵资源。钉钉群链接:链接~戳我戳我。

2024-02-01 11:08:51 268 1

原创 阿里云计算巢千万级高质量问答数据集——赋能多元智能应用与模型训练

优化社区问答(cQA)系统:模拟真实的一问多答场景,针对一个问题找到最相关的既有问题,并依据答案质量、问题与答案的相关性等因素,高效筛选最佳答案。钉钉群链接:链接~戳我戳我。

2024-01-31 18:02:45 227

原创 阿里云计算巢推出520万对高质量中英文平行语料库,赋能机器翻译与自然语言处理研究

首先,它可直接服务于中英文互译系统的训练,推动机器翻译技术的发展,提高翻译结果的质量和流畅度。其次,由于其庞大的中文或英文单语句数量,用户可以抽取单独的语言数据集,用于训练词向量、预训练模型或是其他各类自然语言处理任务,如文本生成、情感分析等,从而提升这些领域的技术水平和应用效果。计算巢官方提供了一个钉钉群,我们可以加入到群中直接跟阿里云官方人员进行交流,他们会非常迅速的帮我们更新数据集,之前我一直想要的wiki数据跟他们反馈后几个小时就给我上架了,速度感人~泪目~钉钉群链接:链接~戳我戳我。

2024-01-31 17:55:55 431

原创 一键搞定钉钉定时自动化通知

在数字化时代,信息流的高效管理成为个人和团队走向成功的必由之路。但是,我们常常发现自己淹没在无休止的数据和通知之中,急需一个能为我们理顺信息,让工作协同变得更加轻松的解决方案。今天,我要向您介绍一个应用与数据集成平台——阿里云计算巢AppFlow,它能够像一个神经中枢,高效地串联起所有关键数据流,并且能够巧妙地运用现代化的通讯工具如钉钉群机器人,实现定时消息通知,让每一个重要信息都能准时送达,每一个紧急任务都不会错过。这样的场景,不禁让人期待:一个简单配置就能释放强大能力的平台,到底有多么神奇?

2024-01-31 09:14:48 870

原创 《超海量中文新闻数据集,一键直达,助你玩转NLP任务,让你的模型轻松练就“读心术”》

计算巢官方提供了一个钉钉群,我们可以加入到群中直接跟阿里云官方人员进行交流,他们会非常迅速的帮我们更新数据集,之前我一直想要的wiki数据跟他们反馈后几个小时就给我上架了,速度感人~泪目~具体划分上,有243万篇新闻作为扎实的训练基石,7.7万篇用于验证阶段的关键测试,还有那神秘的数万篇官方测试数据,虽不提供下载,却在云端静候检验成果的时刻。更令人期待的是,通过访问此数据集,你还能搭建起属于自己的“标题生成器”与“关键词提炼大师”,让模型迅速掌握从长篇报道中抽取精华标题和关键信息的神技。

2024-01-30 14:56:23 287 1

原创 【阿里云计算巢】赋能中文古诗词研究与应用

相比于其他平台,计算巢数据集对我们个人使用者来说还有一个好处,那就是可以非常方便的反馈自己想要的数据集。计算巢官方提供了一个钉钉群,我们可以加入到群中直接跟阿里云官方人员进行交流,他们会非常迅速的帮我们更新数据集,之前我一直想要的wiki数据跟他们反馈后几个小时就给我上架了,速度感人~泪目~借助阿里云强大的基础设施和云原生能力,用户不再受困于网络环境不稳定或下载速度慢等问题,只需一键操作,即可迅速将庞大的“中文诗歌”数据集引入您的工作流,无需顾虑存储和传输难题。钉钉群链接:链接~戳我戳我。

2024-01-30 13:53:36 269

原创 简单几步,钉钉机器人秒变通义千问对话机器人

大模型不知不觉已经火了快一年了,拥有一个能够随时对话使用的大模型已经成为不少人的刚需。然而,最大的问题可能是如何访问和调用对话模型。如果,我是说如果,能在您的即时通讯软件钉钉中直接与通义千问对话,是不是会让这一切更方便快捷?!按照传统方案,我们要实现上述场景可能需要非常繁琐的接入步骤,甚至还需要自行开发很多代码,这样的准入门槛实在,太!高!啦!

2024-01-29 11:20:26 1140

原创 模型时代,数据集哪里找?

Huggingface又上不去了?这里有个新的解决方案!最近,由于来自东方的某种神秘力量,导致Huggingface登陆不上去了或者访问速度特别慢。这让我们这些依赖Huggingface和一些其他平台托管的数据集进行“炼丹”的炼丹师们深感烦恼。现在的解决方案基本是都是自己想办法“科学上网”,但众所周知,科学上网不仅得“氪金”,速度慢还不稳定。但是!最近在阿里云上发现了一个好地方——计算巢数据集市场,可以完美解决大家的问题,让这堵“墙”变成“任意门”~~计算巢数据集是一个高效获取数据集的解决方案,旨在加速

2024-01-19 17:24:13 364 1

原创 中文数据集集合

医学知识库围绕疾病、药物、检查指标等构建,字段包括并发症,高危因素,组织学检查,临床症状,药物治疗,辅助治疗等,可以利用该数据集对ChatGLM或者LLaMA模型进行训练,提高模型在医疗领域的问答效果。

2024-01-19 17:21:36 403 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除