文字链广告一般出现在浏览页面内容时,在广告位上出现的文本广告。主要挑战有:竞价低,利润率单薄;CTR低;转化低;流量大,带来广告引擎的性能问题;Audience的意图不明显。
所有这些挑战最核心的问题,其实都是物料选择的问题。物料选择方式主要有以下几种方案:
1、Supply从广告位上下文中提取关键词,用这些关键词做query请求广告。这就转化为了搜索广告的问题。
2、从信息检索的角度,将context页面拿到广告库中和所有广告做相似度匹配。
3、将广告和页面分类,再使用IR的方式。
第一种关键词抽取的方式,是将问题转化为一个逆搜索的问题,即给定一个页面,找到最匹配的query词,再用该query去召回广告。后续就可复用现有的搜索广告的框架。总体来说是两个步骤:1、抓取页面,分词;2、二分分类器判断候选词是否是关键词。
信息检索的方式,使用完整的Context作为查询串(包括页面内容、浏览用户的属性、偏好,以及环境等),而采用广告作为文档。根据文档和查询串的特征及权重给一个相关性得分,ranking得到评分最高的广告。相似度得分可以采用嘴馋用的相似度度量方式,即余弦相似度。
基于广告分类与页面分析的方法,首先页面和广告采用相同的分类体系分类,分类体系可根据商业意图。后续再计算得分时,考虑两个方面的线性分数之和。一方面是类目得分,即广告类目和页面类目的语义距离,另一方面是搜索串的相似度得分。广告的最终得分再ranking返回。