网页特征提取:
基础特征提取:
1.页面结构特征
2. Refer Query提词
3. 站点频道提词
4. 流量质量特征
5.页面主题类特征
Term赋权:
统计维度:基本的TF*IDF赋权
结构维度:网页结构角度,term 的位置
语义维度:从语义角度理解网页,利用篇章主题
广告库维度:根据关键词的购买信息
从总体上而言: 是以TF*IDF为基础,然后用其他的例如结构维度、语义维度、广告库维度的信息
进行权重的调整。
网页特征提取:
基础特征提取:
1.页面结构特征
2. Refer Query提词
3. 站点频道提词
4. 流量质量特征
5.页面主题类特征
Term赋权:
统计维度:基本的TF*IDF赋权
结构维度:网页结构角度,term 的位置
语义维度:从语义角度理解网页,利用篇章主题
广告库维度:根据关键词的购买信息
从总体上而言: 是以TF*IDF为基础,然后用其他的例如结构维度、语义维度、广告库维度的信息
进行权重的调整。