Skip to content

DETR论文系列

约 542 个字 33 张图片 预计阅读时间 3 分钟

DETR论文

image-20241126094341959

image-20241126094412950

image-20241126112408864

image-20241126094430630

rpn阶段、roi阶段两次sample正负样本的数量

首先在rpn阶段,首先生成不同比例的宽高,以及在不同比例的特征图的比例上生成

需要定义anchor的宽高比、数量

fast RCNN需要在rpn阶段、roi阶段进行两次NMS的计算,消除相同位置重复区域的预测

image-20241126094805311

image-20241126094837655

DETR移除了Anchor的生成,在fast rcnn中,需要在第一阶段生成预设的数量以及宽高比,一些anchor,这些anchor在后续的第二阶段,在网络的输出中进行微调,DETR完全摒弃了这种方式

image-20241126095035129

DETR属于集合预测的模型

目标检测NMS的过程就是排除掉在一些相近的位置上对于同一个类别重复的预测

在DETR中,是没有了这个过程,网络所给出的输出在定义中就是100个结果,这100个结果也是最终的网络预测的结果,包括图片中隐式类的结果,或者某些预测结果是没有目标的,这个预测值100指的是在所有可能的预测结果中的最大值,一般来说一张图片也不会定义100个gt,在其他的目标检测中,在最后一个阶段输出的网络结果的目标框,在没有进行NMS之前,这个数量是多过于100的

DETR的两个核心内容:

image-20241126095505941

一个是Transformer的结果,从标题中就可以看出;第二个是指的二分图匹配

首先介绍二分图匹配

image-20241126095600693

二分图就是定义了两个集合,在每一个集合,在各自的集合内,每一个点没有连接,在两个集合间,有边进行连接;二分图匹配与匈牙利算法,就是如何计算两个集合得到最优分配的问题

image-20241126095807937

image-20241126101125135

image-20241126101146415

image-20241126101406144

image-20241126101429504

image-20241126101450752

image-20241126101528015

辅助损失

image-20241126101556192

image-20241126101653064

但是对于小目标的结果不太好,可能Transformer不太适合小目标

image-20241126101743110

image-20241126101854237

DETR是什么?

image-20241126112542474

Deformable DETR 可变形

image-20241126105649180

Conditional DETR 有条件的DETR

image-20241126105624003

Anchor DETR

image-20241126110002303

DAB-DETR

image-20241126110145156

image-20241126110231457

DN-DETR 去噪DETR

image-20241126110400202

DINO

image-20241126110743159

Lite DETR

image-20241126110855724

Focus DETR

image-20241126111557307

image-20241126111606712

H-DETR

image-20241126111852117

image-20241126111916701

add_circle2024-11-26 09:20:00update2024-11-26 11:25:47