与互联网进行有意义的对话
1. 大语言模型与聊天机器人的兴起
随机鹦鹉大语言模型是经过训练的预测文本系统,旨在模仿互联网的语言风格进行交流。OpenAI的ChatGPT以及其他公司类似系统的巨大成功带来了两大发展。其一,将互联网模型以聊天机器人的形式呈现,通过提示它预测能延续对话的文本;其二,商业护栏机制迅速发展,以避免互联网上某些不当的表达方式,同时强调其他合适的表达。
早期的大语言模型,如OpenAI的GPT - n系列,需通过编程API来访问和实验。将这些编码研究界面简化为第一人称的文本交流是一项卓越的创新,这让我想起谷歌搜索引擎的首次推出,其简洁的纯文本输入框和“我感觉幸运”按钮,比之前的所有搜索引擎都简单得多。许多研究人员(包括我自己)多年来一直在对大语言模型进行实验,但聊天机器人风格的简单用户界面引发了公众的强烈反响。
然而,敏锐的批评者很快发现这种表面的简单具有误导性。尽管ChatGPT经过训练能输出类似对话的内容,但它并非传统意义上的对话伙伴。Clarisse Sieckenius de Souza在其关于人机交互符号工程学的经典著作中,将人类对话理论应用于用户界面设计,她指出用户界面中的真正对话是用户与构建系统的设计者之间的对话。与软件的对话错觉实际上是与“设计者的代理”的对话。计算机看似通过用户界面直接与用户“交谈”,但实际上只是在传递预先编程的信息,就像鹦鹉重复之前听到的词语一样。
2. 互联网文本的作者与内容
大语言模型被训练从互联网获取信息,那么计算机代理代表他人“像互联网一样说话”意味着什么呢?互联网上的文本作者形形色色。有些是善意的好人,如维基百科的编辑、积极的记者或撰写博客和文章的教授,但他们可能会忽视自