ChatGPT的推出引发了广泛的讨论和应用,它的用途多种多样。有些人利用它寻求人生指导,有些人把它当作搜索引擎使用,还有人用它来撰写论文。
在美国,一些大学已经明确禁止学生使用ChatGPT完成作业,并且开发了多种软件工具来识别学生提交的作业是否由GPT生成。
在ChatGPT推出后,至少七家开发商或公司采用AI检测器应对,声称这些工具能够识别出内容是否由人工智能生成。教育工作者、记者以及其他专业人士把这些新开发的算法看作是识别作弊、剽窃以及错误或虚假信息的有效工具。
尽管这听起来十分先进,但斯坦福大学学者最新的研究论文指出了一个重要问题:这些检测器的可靠性并不高。更令人担忧的是,对于非英语母语的真实作者而言,这些检测器的表现尤其不佳。
研究数据揭示了一个严峻现实。尽管在评估美国学生的作文时,这些检测器的表现“几乎完美”,但在对非英语母语学生的托福作文进行评估时,超过半数(61.22%)被错误地标记为由人工智能生成。
情况还有进一步恶化的趋势。研究指出,在评估的91篇托福学生论文中,所有七个AI检测器一致地将18篇(约19%)判定为人工智能生成,而在同一批论文中,有惊人的89篇(约97%)至少被一个检测器错误标记。
*图片源自网络
这项研