解决物体检测中的小目标问题

解决物体检测中的小目标问题

作者丨Jacob Solawetz

来源丨小白学视觉

编辑丨极市平台

为了提高模型在小物体上的性能,我们建议使用以下技术:

  • 提高图像捕获分辨率
  • 提高模型的输入分辨率
  • 平铺图像
  • 通过扩充生成更多数据
  • 自动学习模型锚
  • 过滤掉多余的类

为什么小目标问题很难?

小物体问题困扰着全世界的物体检测模型,查看最新模型YOLOv3、EfficientDet和YOLOv4的COCO评估结果:

查看 AP_S、AP_M、AP_L 以获取最先进的模型。

例如,在 EfficientDet 中,小物体的 AP 仅为 12%,而大物体的 AP 为 51%,这几乎是五倍的差距。

那么为什么检测小物体这么难呢?

这一切都取决于模型,目标检测模型通过聚合卷积层中的像素来形成特征

PP-YOLO中目标检测的特征聚合

并且在网络的末端,基于损失函数进行预测,该损失函数基于预测和地面真实情况之间的差异对像素进行汇总。

YOLO中的损失函数

如果地面真值框不大,则在进行训练时信号会很小。此外,小物体最有可能存在数据标记错误,因此它们的标识可能会被省略,从经验和理论上来说,小物体是难的。

提高图像捕获分辨率

非常小的物体在边界框中可能只包含几个像素——这意味着提高图像的分辨率以增加检测器可以从该小框中形成的特征的丰富度非常重要。因此,如果可能,我们建议尽可能捕获高分辨率的图像。

提高模型的输入分辨率

一旦我们拥有更高分辨率的图像,我们就可以扩大模型的输入分辨率。警告:这将导致大型模型需要更长的训练时间,并且在开始部署时推断速度会更慢。我们可能需要运行实验,来找出速度与性能之间的正确权衡。

在我们关于培训YOLOv4的教程中,我们可以通过更改配置文件中的图像大小来轻松调整输入分辨率。

[net] batch=64 subpisions=36 width={YOUR RESOLUTION WIDTH HERE} height={YOUR RESOLUTION HEIGHT HERE} channels=3 momentum=0.949 decay=0.0005 angle=0 saturation = 1.5 exposure = 1.5 hue = .1 learning_rate=0.001 burn_in=1000 max_batches=6000 policy=steps steps=4800.0,5400.0 scales=.1,.1

在我们的教程中,小伙伴们还可以通过更改“训练”命令中的“图像大小”参数,轻松调整输入分辨率,该教程介绍了如何训练YOLOv5:

!python train.py –img {YOUR RESOLUTON SIZE HERE} –batch 16 –epochs 10 –data ‘../data.yaml’ –cfg ./models/custom_yolov5s.yaml –weights ” –name yolov5s_results –cache

注意:只有在达到训练数据的最大分辨率时,才能看到改进的结果。

平铺图像

检测小图像的另一种很好的策略是将图像平铺作为预处理步骤。平铺可以有效地将检测器放大到小物体上,但允许我们保持所需的小输入分辨率,以便能够进行快速推理。

平铺图像作为 Roboflow 中的预处理步骤

如果在训练期间使用平铺,请务必记住,我们还需要在推理时平铺图像。

通过扩充生成更多数据

数据扩充会从我们的基本数据集生成新图像,这对于防止模型过度拟合训练集非常有用。

一些特别有用的小物体检测增强包括随机裁剪、随机旋转和镶嵌增强。

自动学习模型锚

锚定框是模型学习预测的原型边界框,也就是说,锚框可以预先设置,有时对于我们的训练数据来说不是最理想的。自定义调整这些参数以适合我们即将完成的任务是很好的,YOLOv5 模型架构会根据我们的自定义数据自动为我们执行此操作,我们所要做的就是开始训练。

Analyzing anchors… anchors/target = 4.66, Best Possible Recall (BPR) = 0.9675. Attempting to generate improved anchors, please wait… WARNING: Extremely small objects found. 35 of 1664 labels are < 3 pixels in width or height. Running kmeans for 9 anchors on 1664 points… thr=0.25: 0.9477 best possible recall, 4.95 anchors past thr n=9, img_size=416, metric_all=0.317/0.665-mean/best, past_thr=0.465-mean: 18,24, 65,37, 35,68, 46,135, 152,54, 99,109, 66,218, 220,128, 169,228 Evolving anchors with Genetic Algorithm: fitness = 0.6825: 100%| | 1000/1000 [00:00<00:00, 1081.71it/s] thr=0.25: 0.9627 best possible recall, 5.32 anchors past thr n=9, img_size=416, metric_all=0.338/0.688-mean/best, past_thr=0.476-mean: 13,20, 41,32, 26,55, 46,72, 122,57, 86,102, 58,152, 161,120, 165,204

过滤掉多余的类

类管理是提高数据集质量的一项重要技术,如果我们的一个类与另一个类明显重叠,则应从数据集中过滤该类。也许,我们认为数据集中的小对象不值得检测,因此我们可能想要将其取出。通过Roboflow Pro中的高级数据集进行状况检查,我们可以快速识别所有这些问题。

可以通过Roboflow 的本体管理工具来实现类遗漏和类重命名。

郑重声明:本文内容及图片均整理自互联网,不代表本站立场,版权归原作者所有,如有侵权请联系管理员(admin#wlmqw.com)删除。
(0)
用户投稿
上一篇 2022年6月12日
下一篇 2022年6月12日

相关推荐

  • python经济学模型 Python+经济学:成本函数与图像

    前言: 本文可以说是上一篇文章的“姊妹篇”,同样利用一元二次函数图像的性质,构造边际成本函数(Marginal Cost Function),然后在此基础上还原各种成本函数。为了让…

    2022年6月28日
  • 高特效畅玩荒野大镖客2,GPD WIN MAX2的R7 6800U真强

    关于《荒野大镖客2》这款3A级PC大作小伙伴们应该都不陌生了,玩起来的时候我往往会被这个波澜壮阔的西部世界的画面所震撼。内里丰富的NPC设置,细腻的还原了那个曾经的西部世界。开启画…

    2022年7月22日
  • BA专业如何在游戏领域占领一席之地?

    前言: 世界上最幸福的事情,莫过于投身于自己热爱的事业。当打游戏的爱好和BA专业完美结合的时候,相信友友们每天上班,都会热情满满以及无比幸福。但是这个行业具体前景如何?BA专业的同…

    2022年7月2日
  • 2022VR设备加购指南 – VR眼镜怎么选

    2022VR设备加购指南-VR眼镜怎么选?废话不多说,直接上干货,目前市面上在售的VR设备大致分为分体机与一体机两类。 下面将分别举例与介绍一下,市面上比较有代表性的分体机与一体机…

    2022年8月3日
  • 使用ΛCDM模型计算宇宙年龄

    ΛCDM模型是Λ-冷暗物质模型的简称,它通常被认为是宇宙学的标准模型。当然,它并不是唯一的模型,但它已被证明在解释宇宙微波背景的存在方面相当成功,这是宇宙学中最重要的发现之一。此外…

    2022年8月18日
  • 1.7亿条学生个人信息遭泄露?学习通要解释的还有很多

    6月21日,针对“疑似学习通APP用户数据泄露”的信息,学习通官方微博发布声明回应称,到目前为止还未发现明确的用户信息泄露证据。已经向公安机关报案,公安机关已经介入调查。 此前,据…

    2022年6月24日
  • 中国1-7月进口芯片减少12%,430亿块,美国有点慌,芯片卖给谁?

    近日,海关总署发布了1-7月份,国内的进出口数据。 上面显示,2022年1-7个月份,我国累计进口芯片数量为3246.7亿个,同比缩减11.8%,相当于减少了434亿块。 而进口芯…

    2022年8月12日
  • 浦东建设最新公告:中标合计10.36亿元工程项目

    浦东建设公告,公司子公司中标多项重大工程项目,中标金额合计10.36亿元。 截至2022年7月27日收盘,浦东建设(600284)报收于7.05元,下跌0.84%,换手率0.9%,…

    2022年8月4日
  • 您家有旧家电吗?快来以旧换新啦!全国家电以旧换新活动已开始

    聪明的投资者更善于使用工具 —— 摸象 7月22日,国务院新闻办公室举行国务院政策例行吹风会,介绍促进绿色智能家电消费有关情况。商务部副部长盛秋平介绍,将于近期发布的《关于促进绿色…

    2022年8月1日
  • 中国版的Google Docs,不是只有“一起写”

    正如你所见,疫情之下,在家办公开始流行。 腾讯文档 由于远程办公的突然爆发,也带火了一批在线的办公软件,如腾讯文档,就是将Office“云化”,让用户无需下载应用,即可通过网络共享…

    2022年6月18日

联系我们

联系邮箱:admin#wlmqw.com
工作时间:周一至周五,10:30-18:30,节假日休息