AGGA: A Dataset of Academic Guidelines for Generative AI and Large Language Models

在这里插入图片描述

文章主要内容

  1. 研究背景:生成式人工智能(GAI)和大语言模型(LLMs)在学术界的应用日益广泛,但相关政策存在不足。联合国教科文组织调查显示,不到10%的学校和大学制定了正式政策,因此需要综合框架平衡创新与伦理考量。
  2. 数据集介绍:引入AGGA数据集,包含来自六大洲80所大学的学术指南,涵盖多种学术领域和机构类型,总字数达188,674字。数据集有MS Word、PDF和MS Excel三种格式,方便不同分析需求。
  3. 研究方法:从全球80所大学收集官方指南,依据地理位置和运营层面分类。运用Python和自然语言处理工具(如NLTK)进行文本挖掘和计算处理,包括分词、去除停用词、词干提取和词形还原等操作。
  4. 数据分析与验证:通过文本分析和可视化,识别出各大洲的热门关键词,并构建网络图表展示关键词与大洲之间的关系。验证了数据集的包容性和全球代表性,如不同大洲在人工智能应用方面有不同侧重点。
  5. 使
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值