(Shuang Li, Faliang Chang, Chunsheng Liu , Nanjun Li)

一、本文的主要贡献

二、网络结构

总体网络架构如下图所示

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/0e95c505-b2d2-4123-811a-f1e13f20639d/Untitled.png

2.1 pyramid-YOLO网络

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/b155a34d-749a-457a-840c-0b893a6b907a/Untitled.png

使用三个相同的YOLO-v3层叠成金字塔的形式,然后将原图缩放为3个尺寸的大小(原图大小、1/2原图大小,1/4原图大小),然后分别输入到YOLO-v3中,最终得到9个预测框(因为每个YOLO-v3网络都会输出三个不同尺寸的预测框,三个YOLO-V3则有9个),然后将检测结果映射会原图,得到检测目标,这样可能会出现同个目标有多个检测框,则使用**NMS(非极大值抑制法)**来挑选有用最高分数的的那些预测款,挑出来的预测款就是最终结果。

2.2 restricted multi-tracking-based LOI counting

<aside> 💡 LOI:the line of interest counting

</aside>

<aside> 💡 ROI:region of interest counting

</aside>

2.2.1 设置计数线和选择跟踪的汽车