效果达OpenAI同规模模型96%,发布即开源!国内团队新发大模型,CEO上阵写代码...

国内创业团队虎博科技发布开源大语言模型TigerBot,包含70亿和1800亿参数版本,性能接近OpenAI同规模模型的96%。模型支持多任务,如生成、问答、编程等,并具备开源数据和代码。团队在指令完成监督微调、可控性和事实性、并行训练等方面实现技术创新,提高学习能力和生成质量。CEO陈烨带领小团队快速开发,旨在提供高效、低成本的AI解决方案。
摘要由CSDN通过智能技术生成
明敏 发自 凹非寺
量子位 | 公众号 QbitAI

国内自研大模型迎来新面孔,而且发布即开源!

最新消息,多模态大语言模型TigerBot正式亮相,包含70亿参数和1800亿参数两个版本,均对外开源

由该模型支持的对话AI同步上线。

写广告语、做表格、纠正语法错误,效果都不错;也支持多模态,能生成图片。

4b1dddb0d4f266fd9abddc1f8a647267.gif

评测结果显示,TigerBot-7B已达到OpenAI同样大小模型综合表现的 96%

f2f243293d1ab33e720d197c3d123eb2.png
公开 NLP 数据集上的自动评测,以OpenAI-instruct GPT-6B-SFT为基准,归一化并平均各模型的得分情况

而更大规模的TigerBot-180B或是目前业内开源的最大规模大语言模型。

此外,团队还一并开源100G预训练数据、监督微调1G或100万条数据

基于TigerBot,开发者在半天内就能打造出自己的专属大模型。

目前TigerBot对话AI已邀请内测,开源代码数据等已上传至GitHub(详细链接见文末)。

1cc83325a60d340e6d4639840dafbc36.png

如上这些重磅工作,来自一支最初只有5人的小团队,首席程序员&科学家就是CEO本人

但这个团队,绝非师出无名。

从2017年起,他们就在NLP领域开始创业,专长垂直领域搜索。最擅长对数据重度以来的金融领域,和方正证券、国信证券等有过深入合作。

创始人兼CEO,有着20多年从业经验,曾任UC伯克利客座教授,手握3篇最佳顶会论文和10项技术专利。

如今,他们决心从专长领域走向通用大模型。

而且一开始便从最底层的基础模型做起,3个月内完成3000次实验迭代,还有底气将阶段性成果对外开源。

不禁让人好奇,他们是谁?想要做哪些事?如今已经带来了哪些阶段性成果?

TigerBot是什么?

具体来看,TigerBot是一款国产自研的多语言任务大模型。

覆盖生成、开放问答、编程、画图、翻译、头脑风暴等15大类能力,支持子任务超过60种。

75a83a3d08441b194479d6bf21708117.gif

而且支持插件功能,能让模型联网,获取到更加新鲜的数据和信息。

80f05986b4f54e1a18198ee12070ea3e.png

它的定位更偏向办公场景,提出改善人们工作流、提高效率的目标。

比如让它来帮我写一条Apple Vision Pro的新闻快讯,效果有模有样:

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值