在字节跳动,机器学习算法被应用在许许多多不同的场景:
在今日头条里,你被推荐的文章;
在抖音里,你用到的那些活灵活现的视频特效;
在飞书里,把你说的话转化为文字的功能;
在前不久公测的 AI 对话产品「豆包」里,AI 给你生成的文本段落;
……
这些算法模型,是怎样生产出来的?
或许你会回答:“收集数据,找预训练模型,在 GPU 上训练,然后各种微调……”
但当我们有很多位算法工程师、要训练许许多多模型、使用很多 GPU、管理海量数据的时候,又应该怎么办呢?
靠的是字节跳动的
在字节跳动,机器学习算法被应用在许许多多不同的场景:
在今日头条里,你被推荐的文章;
在抖音里,你用到的那些活灵活现的视频特效;
在飞书里,把你说的话转化为文字的功能;
在前不久公测的 AI 对话产品「豆包」里,AI 给你生成的文本段落;
……
这些算法模型,是怎样生产出来的?
或许你会回答:“收集数据,找预训练模型,在 GPU 上训练,然后各种微调……”
但当我们有很多位算法工程师、要训练许许多多模型、使用很多 GPU、管理海量数据的时候,又应该怎么办呢?
靠的是字节跳动的