文章目录
  1. 1. 1. 论文简介
  2. 2. 2. 内容

1. 论文简介

SSH论文全称《SSH: Single Stage Headless Face Detector》,2017年8月份出来的一篇基于SSD结构的一篇人脸检测论文。该论文的code开源在github上,基于pycaffe。

2. 内容

该论文主要采用了SSD类似结构直接做人脸的检测以及边框回归,区别于之前的MTCNN那种多级的结构。其次在检测不同Scale人脸方面采用了skip connections结构,即靠前的feature map 接收野小,用于检测较小人脸,靠后的feature map接收野大,检测较大人脸。
2-FD-SSH-frame-1.PNG-193.3kB
2-FD-SSH-frame-2.PNG-44.5kB
在SSD基础上在feature map上做不同scale人脸的检测与回归。除此之外,模型还做了不少Inception类似的结构做分支以及合并操作,文章称为增大接收野,也就是人脸周边的context信息。
feature map上的anchors只有一个比例即1,K个不同的大小。正常情况下训练时feature map M1,M2,M3都可以检测并且回归所有的人脸,但是文章设计3个不同的通道是为了分别检测不同scale的人脸,如何做到这一点了?
“To specialize each of the three detection modules for a specific range of scales, we only back-propagate the loss for the anchors which are assigned to faces in the corresponding range. This is implemented by distributing the anchors based on their size to these three modules (i.e. smaller anchors are assigned to M1 compared to M2, and M3). An anchor is assigned to a ground-truth face if and only if it has a higher IoU than 0.5.”
从文章中可以看到,在计算anchors与gt的IOU区别pos 和 neg时,预先设定了3个模型能够检测的人脸大小范围,即将gt人脸按照大小分别分给3个模型,然后某个模型的anchors只与分配给它的gt face计算IOU来判定该anchor是pos or neg。其次文章采用OHEM来提高模型准确率。

文章目录
  1. 1. 1. 论文简介
  2. 2. 2. 内容