RankLib源码分析(一):主框架

Evaluator类分析:
1.main函数的入口:
ciir.umass.edu.eval.Evaluator

2.指定算法
221行:
else if(args[i].compareTo("-ranker")==0)
rankerType = Integer.parseInt(args[++i]);
413行:
Evaluator e = new Evaluator(rType2[rankerType], trainMetric, testMetric);

3.指定数据的输入,划分(指定训练集,校验集和测试集)
Evaluator.evaluate函数(多个该函数,指定了不同的数据输入方式)

4.训练器
evaluate函数里:
RankerTrainer trainer = new RankerTrainer();
Ranker ranker = trainer.train(type, trainingData, validation, features, trainScorer);

5.测试结果
evaluate函数里:
double rankScore = evaluate(ranker, testData);


RankerTrainer类 分析:
1.通过RankerFactory,选定出指定的算法类(统一的基类为:Ranker类),具体有:
new MART(),
new RankBoost(),
new RankNet(),
new AdaRank(),
new CoorAscent(),
new LambdaRank(),
new LambdaMART(),
new ListNet(),
new RFRanker(),
new LinearRegRank()
2.记录训练的时间

Ranker类分析(抽象类):
1.该类为所有的算法的基类,包含了一些通用的方法,
例如,设置训练集,设置检验集,设置feature,设置评价方式,以及给出评分后的排序
public RankList rank(RankList rl)
{
double[] scores = new double[rl.size()];
for(int i=0;i<rl.size();i++)
scores[i] = eval(rl.get(i));
int[] idx = MergeSorter.sort(scores, false);
return new RankList(rl, idx);
}
public List<RankList> rank(List<RankList> l)
{
List<RankList> ll = new ArrayList<RankList>();
for(int i=0;i<l.size();i++)
ll.add(rank(l.get(i)));
return ll;
}

2.为具体算法实现保留的方法主要有:
public abstract void init();  //初始化
public abstract void learn();  //学习模型
public double eval(DataPoint p) //给指定点打分
{
return -1.0;
}
  public abstract String model(); //建模


3.具体的实现类只需要考虑学习和评分即可,具体的排序已在该抽象类完成


4.数据格式
3 qid:1 1:1 2:1 3:0 4:0.2 5:0 # 1A
DataPoint:
1.label,评分(1,2,3,4等)相当如bad,good,very good之类
2.id,文档编号;
3.后面全是feature;
要求同一个qid的必须放到一起。

RankList是相同qid的DataPoint的列表,无排序。





  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值