Open AI新一代语言模型GPT-2不需特定领域数据

Open AI最近发布新一代的大型语言模型GPT-2,该模型有15亿个参数,利用了800万页的网页数据作为训练数据,以预测所有输入文字的下一个字作为训练目标,而也因为数据集的多样性,让模型不需要针对特定的任务进行训练,以上述单纯的目标,就能涵盖了许多跨领域的任务,目前该模型能够在机器翻译、回答问题、阅读理解、总结段落等语言任务中生成与段落一致的文字内容,不过,为了预防恶意的使用行为,OpenAI并不会释出训练完的模型,只会发布技术论文和一个相较之下规模小很多的模型,提供研究人员做实验。

图片来源:http://www.cafes.org.tw/info.asp

GPT-2模型在许多语言任务中,都达到了很好的表现,举例来说,给定模型一段文字,模型就能产生接续段落的文字,而该模型的表现,也超越了用特定领域训练数据训练而成的模型,像是维基百科、新闻或是书籍等特定训练数据。此外,在像是问题回答、阅读理解、段落总结,以及翻译等语言任务中,GPT-2模型是从原始的文字数据开始学习,没有透过特定任务的数据来训练,而最终模型在这些任务上的表现也超越了现今效果最好的模型。Open AI表示,通用的语言模型将能够对社会产生很大的影响,也能够促成许多相关的应用,Open AI期望像GPT-2这样的模型能够被用来创造写作AI助理、更有能力的对话机器人、跨语言的非监督翻译模型、更好的语言理解系统等,但是同时,Open AI也担忧这样的模型会被用于恶意的用途,像是制造误导新闻、伪造他人、在社群平台自动产生假内容,或是垃圾讯息等,因此只会释出小型的GPT-2模型,并不会释出训练数据集、程序代码和模型的权重。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值