(一)关键词:三大套路
大模型火了,大模型的套路也火了。
套路一:
但凡有点科技含量的公司,
没个大模型都对不起“市值”和“估值”。
面子谁不要?
那用开源。
套路二:
说早有布局,
却无论文,
无数据,
无“卡”,
无历史进展,
套路三:
为了“大”而“大”。
谭老师我和腾讯AI科学家深聊:
广义线性模型的时代,腾讯广告也曾追求过参数量大。
然而,这种模型学习能力很一般。
如果只是模型的参数总量高,参与计算的参数量却很少,
这样的“大模型”,没意思。
腾讯在AI这块不算“激进派”,但大模型没玩套路。
腾讯广告将两个大模型用到了广告业务。
参数都是千亿级别。
既然是两个,分工多说两句。
广告大模型提升了广告系统的运算能力,
腾讯混元大模型提升了广告系统的理解和生成能力。
我们先聊广告大模型,再聊混元大模型。
(二)关键词:广告商机转瞬即逝
先聊聊,广告竞争的本质。
从“从前”讲起,
百货商店橱窗里的塑料假人,是展示,也是广告。
后来,美国人研究如何用计算的方法求解广告中的各类问题。
将一部分的计算策略交给机器学习。
早期,广告对机器学习模型的要求,哪怕能力弱一点,算得快一点就可以了。
比如,给一条男士冲浪花裤衩打个广告。
广告系统有三层:
召回,粗排,精排。
每层边选,边匹配。
广告系统里的模型,有些像漏斗。
先粗排,
模型发现:这条花裤衩男的喜欢,女的无感。
再精排,
模型发现花裤权不是所有男性都喜欢,颜色骚气,
大约20岁