Detect AI Generated(Kaggle竞赛)
每篇文章的标题前面都有一个标题,如 .当注明作者时,他们的名字将在标题中给出。测试集中大约有 9,000 篇论文,包括学生撰写的和 LLM 生成的。所有的文章都是根据七个论文提示之一写的。几乎所有的训练集论文都是由学生撰写的,只有少数生成的论文作为示例。generated- 论文是由学生()撰写的,还是由法学硕士()撰写的。[PAD] (Padding Token): 用于文本序列的填充,使所有输入的长度匹配,常用于处理成批数据。train_prompts.csv - 论文是针对这些领域的信息而写的。
原创
2024-04-16 02:08:16 ·
1061 阅读 ·
0 评论