内容纲要

欢迎转载,作者:Ling,注明出处:Rank教程: 10-Learning to Rank Aggregation

 

本文不打算详细介绍每个算法,具体算法细节可以看Paper,但是本文会大致给出算法的核心思想。实际上所有算法都可以对应到机器学习的基础算法中。

Ranking Aggregation:

定义:

简单说就是给定Query和文档O,我们有不同的Ranking System得到不同的排序结果,然后综合考虑这些排序结果,给出最终排序结果。

主要方法:

  • Borda Count
  • Markov Chain based ranking aggregation
  • Cranking

Borda Count:

提出者:

Aslam & Montague

原理简述:

有多个ranking list

对于每个ranking list,排名第一的文档获得n分,排名第二的文档获得n-1分

然后累加每个文档计算最终得分

按照最终得分给所有文档排序

Markov Chain based ranking aggregation:

提出者:

Dwork et al.

原理简述:

利用不同的rank list统计文档转移概率,然后利用转移概率计算最佳的排序结果

Cranking:

提出者:

Lebanon & Lafferty

原理简述:

利用不同的rank list结合马尔科夫蒙特卡洛搜索Markov Chain Monte Carlo (MCMC)