图像检索：Oxford Building dataset的问题

计算机视觉

Oxford Building dataset（后面简称为Oxford）从2007年发布，到2018年Revisiting Oxford and Paris重新整理发布为Revisiting Oxford Building dataset（后面简称为ROxford），整整十年，实例检索（instance retrieval）或物体检索（object retrieval）都跑在一个Ground Truth定义得不是很合理的数据上进行MAP（Mean Average Precision）评估，这期间，虽然有人意识到了Oxford数据集存在的问题，却一直等到10年后，才有人正式的对这个数据集GT定义的合理性给出正面的回应。

Oxford数据集小白菜也一直在用，之所以在实际中验证一些检索算法指标的时候喜欢用这个数据集，是因为这个数据集对小白菜而言，有两个优点：

计算MAP指标比较明晰（具体可以之前写过的关于Oxford MAP的计算过程），方便
数据集规模不大，共5063张图片，验证起来比较快

然后小白菜也这么一直用着，虽然ROxford新定义的GT已经发布了。直到最近，在验证开发的局部特征检索系统在公开数据集上的效果时，一如既往的选择了Oxford的MAP作为衡量指标，发现了针对一些query，其定义的GT存在非常不合理的地方，下面举一个具体的query予以说明。

在Oxford里，all_souls_000013.jpg作为query（见all_souls_1_query.txt）时，包含相同建筑目标的all_souls_000206.jpg被当做跟query不相关的图片，放在了junk里（见all_souls_1_junk.txt）。all_souls_000013.jpg和all_souls_000206.jpg对应的图片分别为：

drawing