Hugging Face创始人亲述：一个GitHub史上增长最快的AI项目

OneFlow深度学习框架

已于 2022-05-12 16:55:06 修改

阅读量1w

点赞数 12

分类专栏：业界观点文章标签：大数据编程语言 python 机器学习人工智能

于 2022-05-11 12:33:56 首次发布

本文链接：https://blog.csdn.net/OneFlow_Official/article/details/124722838

版权

Hugging Face从一个对话机器人项目转变为AI开源社区的领导者，其Transformers库成为GitHub上增长最快的机器学习库。公司获得了1亿美元C轮融资，估值达到20亿美元。Hugging Face提供了超过100,000个预训练模型和10,000个数据集，涵盖多个领域，成为科学家和从业者的资源中心。CEO Clément Delangue认为，通过搭建平台连接科学与生产，是公司成功的关键。Hugging Face的目标是成为机器学习领域的“GitHub”，促进社区驱动的创新和发展。" 79949192,7289046,等比数列求和的高效算法,"['算法', '数学', '数论', '数据结构']

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

来源｜Gradient Dissent

翻译｜贾川、胡燕君

Hugging Face，这家以emoji“抱抱脸”命名的开源创业公司，以一种连创始团队不曾预料的速度成为了AI开源社区的顶级“网红”。目前，Hugging Face模型库在Github上获得了超过62,000个Star，14,000次forks，代码贡献者超1200人，每月被安装超100万次。

就在5月10日，Hugging Face宣布C轮融资筹集了1亿美元，由Lux Capital领投，红杉资本、Coatue、Betaworks、NBA球星Kevin Durant等参与投资，目前估值达到20亿美元。由此，Hugging Face进一步在业内引发强烈反响。

很多人好奇Hugging Face为何能一炮而红？凭什么受到资本青睐？

故事还要从2016年说起，法国连续创业者Clément Delangue（曾创办笔记平台VideoNot.es，媒体监测平台mention以及被Google收购的移动开发平台Moodstocks等项目）和Julien Chaumond、Thomas Wolf一起创办了Hugging Face，并从Betaworks和NBA球星杜兰特等拿到天使融资，他们最开始的方向是做对话机器人，但跟当时很多做类似方向的创业公司一样，一直没有起色。

直到2019年，为了训练聊天机器人的NLP能力，他们在GitHub开源了一个Transformers库，令人意外的是，在机器学习社区迅速流行起来，成为GitHub史上增长最快的机器学习库。无心插柳柳成荫，运气，有时就是这么邪门儿。

不止于NLP库，Hugging Face也在逐渐变成机器学习领域的ModelHub中心。如今，Hugging Face已经共享了超100,000个预训练模型，10,000个数据集，涵盖了 NLP、计算机视觉、语音、时间序列、生物学、强化学习等领域，以帮助科学家和相关从业者更好地构建模型，并将其用于产品或工作流程。现在，他们发起的BigScience项目，吸引了超1000名研究者共同训练超大规模模型。

作为一家商业公司，Hugging Face也从去年的30人扩张到了120多人，有超过10,000家公司在使用他们的产品和服务，其中付费用户超过1000。

Clément认为，取得这些成绩的主要原因在于，Hugging Face弥补了科学与生产之间的鸿沟，通过搭建平台为开源界和科学界赋能，所产生的价值比通过搭建专有工具产生的价值要高上千倍，而很多开源软件和公司都没有做到这一点。某种程度上，Hugging Face是在构建机器学习领域的“GitHub”，让其成为一个由社区开发者驱动的平台。

2021年6月，在机器学习播客《Gradient Dissent》中，Lukas Biewald与Hugging Face的CEO兼联合创始人Clément Delangue聊了聊Hugging Face Transformers库兴起的背后故事，揭示了Hugging Face快速增长的缘由，后者也分享了他对NLP技术发展的见解。

以下为对话内容，OneFlow社区做了不改变原意的编译。

Transformers库的源起

Lukas：2019年，是什么启发你们要搭建这样的Transformers开源库？

Clément：真实情况是，并没有考虑太多。当时我们使用开源库有一段时间了，在这个领域，总感觉我们是站在巨人的肩膀上在前进，许多人在从事科学研究时，已习惯了这样的方式。比如当你发表关于机器学习的研究时，可能更倾向于以开源而不是论文的形式发表。因此，从研发Hugging Face的第一天开始，我们就在开源库中进行共享。

至于Transformers