内容纲要

欢迎转载,作者:Ling,注明出处:Rank教程: 07-Learning to Rank Pointwise

 

本文不打算详细介绍每个算法,具体算法细节可以看Paper,但是本文会大致给出算法的核心思想。实际上所有算法都可以对应到机器学习的基础算法中。

 

单文档方法(PointWise Approach):

定义:

简单说就是一个查询q和一个文档o可以得到输入特征x,以及输出label y,用机器学习方法学习模型,当给定q和o时,我们得到相应输入特征x,输入给模型,得到结果y,然后根据结果y进行排序,这就是PointWise方法。实际上就是把Rank问题转化成了分类问题。

形式化:

RK_07_001

主要方法:

  • Prank
  • OC SVM
  • McRank
  • Subset Rank

Prank:

提出者:

Crammer & Singer

原理简述:

简单说就是利用了机器学习中感知机解决多分类问题

图示:

RK_07_002

算法:

RK_07_003

OC SVM: Ordinal Classification SVM

提出者:

Shashua & Levin

原理简述:

简单说就是利用了机器学习中SVM解决多分类问题

图示:

RK_07_004

算法:

RK_07_005

McRank:

提出者:

Li et al.

原理简述:

简单说就是利用了Gradient Boosting Tree解决多分类问题。

McRank:

提出者:

Cossock & Zhang

原理简述:

简单说就是将Rank转化为回归问题, 并且提出了DCG这个指标。