商业P4P引擎架构

[b]P4P的关键参数[/b]:
PV(pageView):页面浏览量,也就是流量。
CTR(click through rate):点击率,一般的竞价排名都是按点击收费。
cov:覆盖率,页面中付费广告的比值。
PPC(pay per click):每次点击扣费,一般按照第二价格扣费,想了解详细可以搜索第二价格拍卖。
这些关键参数影响了竞价排名的收入。
说完了关键参数,接着介绍P4P的架构。

[b]一般的P4P引擎由以下部分组成:[/b]
Blender:负责将外部查询语句改为内部查询语句(扩展加词,加密)。
Merger:负责分发,合并,排序,cache。
Searcher:提供索引查询服务,分词,排序。
Cm:负责blender,merge,search的调度;监听服务器load,cpu等参数。
Dispath&lsupdate:接受外部消息。
Click:记录,分析点击。
Fullbuild:从DB中dump数据,建立索引。

[b]可以看出一般的p4p搜索引擎架构如下:[/b]
1定时通过爬虫/数据库获取数据,建立索引。
2实时获取数据,建立增量索引。
3用户输入查询信息。
4对用户的查询语句进行转化(扩展,加密等)
5通过负载均衡和分发服务分发给不同服务器。
6查询服务器进行分词,检索出结果,排序。
7合并服务对查询结果进行汇总,排序。
8监控服务负责对服务器进行监控。
9点击系统记录,分析用户点击信息。
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值