要说现在人工智能界最火的东西,那大语言模型肯定榜上有名,这可不只是技术上的小花招,它们真的能开启新世界的大门,让咱们想到的事情都能变成现实。
入门级
GPT-2
论文:Language Models are Unsupervised Multitask Learners
刚开始接触大语言模型的话,OpenAI推出的GPT-2小模型版,比如那个117M参数的,是个不错的起点。这类模型对电脑配置要求没那么高,比较容易上手,就像玩游戏先从简单级别开始一样,摸索这些小模型可以帮你逐渐搞懂大语言模型的套路,为将来挑战更高级别的模型做好准备。
DistilBERT
论文:DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter
它就像是BERT的迷你版,在把BERT的主要特点都保留下来的同时还变得更小巧,速度也快了不少。如果你是新手或者已经有点基础,想进一步弄明白Transformer和BERT是怎么回事,DistilBERT就挺合适的。
</