点击率预测 可以使用LDA的变体,低维空间的表示 因为LDA要求句子比较长有专门处理tweet短文本的LDA 多少个keyword会指向document,如有50个Keyword指向d1,就可以找出topic,慢慢建图 建立keyword和result的二分图。 keyword中可能有些停用词,需要去除停用词,可以根据tfidf的方法:除去在大量查询中出现的词