调研报告之AI目标检测

标签: 无 分类: 未分类 创建时间:2024-08-04 04:28:03 更新时间:2025-01-17 10:39:24

1.前沿

目标检测是计算机视觉的一个重要任务,其主要目标是在给定的图像或视频中准确地找出物体的位置和识别物体的类别。目标检测的原理基于图像处理和机器学习技术。一般来说,目标检测包括以下几个基本步骤:
候选区域生成:首先,通过一些技术(如滑动窗口、区域提案方法等)生成一系列可能包含目标物体的候选区域。
特征提取:对于每个候选区域,利用图像处理技术提取其特征表示。常用的特征提取方法包括边缘检测、颜色直方图、纹理分析等。
物体分类:将每个候选区域的特征输入到机器学习算法中进行分类,确定每个候选区域是目标物体还是背景。常用的分类算法包括支持向量机(SVM)、卷积神经网络(CNN)等。
边界框回归:对于被分类为目标的候选区域,通过边界框回归技术精确地确定其位置,得到最终的目标检测结果。

常用的目标检测算法:

  • Faster R-CNN:基于深度神经网络的物体检测算法,通过生成候选区域和进行分类回归两个阶段来检测物体
  • YOLO:You Only Look Once,一种实时物体检测算法,将物体检测和分类合并为一个回归问题,可以在实时场景中高效地检测物体。YOLO系列方法在速度和准确率之间取得了很好的平衡。
  • SSD:Single Shot MultiBox Detector,一种基于深度神经网络的物体检测算法,采用多尺度特征图检测不同大小的物体。
  • Mask R-CNN:在 Faster R-CNN 的基础上增加了对物体分割的支持,可以同时得到物体的位置、大小和分割掩膜。
  • Haar特征级联分类器:Haar特征级联分类器是一种基于特征的目标检测方法。它通过计算图像中不同位置和尺度上的Haar特征来判断是否存在目标物体。该方法具有快速计算和较高的检测准确率的优点,广泛应用于人脸检测等领域。
  • HOG特征+SVM分类器:HOG(Histogram of Oriented Gradients)特征是一种用于目标检测的图像特征表示方法。它通过计算图像中每个区域的梯度方向直方图来表示目标物体。结合支持向量机(SVM)分类器,可以实现高效准确的目标检测。
  • R-CNN系列:R-CNN(Region-based Convolutional Neural Networks)是一种基于区域的卷积神经网络方法。它通过生成候选区域,并对每个区域进行卷积神经网络的特征提取和分类,实现目标检测。R-CNN系列方法的优点是准确性较高,但计算复杂度较大。
参考文章:
【1】.常见物体检测算法
【2】.目标检测:在图像或视频中检测物体的位置和类别
【3】.13.3. 目标检测和边界框 在图像分类任务中,我们假设图像中只有一个主要物体对象,我们只关注如何识别其类别。 然而,很多时候图像里有多个我们感兴趣的目标,我们不仅想知道它们的类别,还想得到它们在图像中的具体位置。 在计算机视觉里,我们将这类任务称为目标检测(object detection)或目标识别(object recognition)。
【4】.2023年目标检测研究进展 这是一篇英文论文,主要内容:1:本文主要总结近两年的部分目标检测成果。2:本文通过这些研究给出学派发展方向参考。3:本文针对理论基础研究进行探索性的分析。4:个人目前相关工作内容的一些基本的介绍(命名实体识别,文献情报分析,摘要内容生成,亚像素图像处理,超分辨图像处理,编码器,解码器,生成器,判别器,基于加瓦罗定理及海涅定理的认知计算理论研究,基于多模态可编程异构的下一代芯片设计,互联实时芯片操作系统
【5】.第八章 目标检测 1.基本概念。2.Two Stage目标检测算法。3.One Stage目标检测算法。4.人脸检测。5.目标检测的技巧汇总。6.目标检测的常用数据集。7.目标检测常用标注工具。8.目标检测工具和框架。

2.入门教程

(1)传统目标检测算法:

  • Viola Jones Detector
  • HOG Detector
  • DPM Detector

(2)Anchor-Based中的Two-stage目标检测算法

  • RCNN
  • SPPNet
  • Fast RCNN
  • Faster RCNN
  • FPN
  • Cascade RCNN

(3)Anchor-based中的one-stage目标检测算法

  • YOLO v1

  • SSD

  • YOLO v2

  • RetinaNet

  • YOLO v3

  • YOLO v4

  • YOLO v5

    (4)Anchor-Free中的目标检测算法

  • CornerNet

  • CenterNet

  • FSAF

  • FCOS

  • SAPD

参考文章:
【1】.CVHub | 万字长文带你入门目标检测 目标检测领域发展至今已有二十余载,从早期的传统方法到如今的深度学习方法,精度越来越高的同时速度也越来越快,这得益于深度学习等相关技术的不断发展。本文将对目标检测领域的发展做一个系统性的介绍,旨在为读者构建一个完整的知识体系架构,同时了解目标检测相关的技术栈及其未来的发展趋势。
【2】.手把手教你如何自制目标检测框架(从理论到实现)
【3】.67. 目标检测原理与实践 这里有原理说明,还提供了相应的测试代码。R-CNN 家族;YOLO 和 SSD;Mask R-CNN;TensorFlow Object Detection
【4】.目标检测 在给定图像或视频流的情况下,目标检测模型可以识别可能存在已知目标集合中的哪些目标,并提供关于它们在图像中的位置的信息。

3.框架

小额赞助
本人提供免费与付费咨询服务,感谢您的支持!赞助请发邮件通知,方便公布您的善意!
**光 3.01 元
Sun 3.00 元
bibichuan 3.00 元
微信公众号
广告位
诚心邀请广大金主爸爸洽谈合作
每日一省
isNaN 和 Number.isNaN 函数的区别?

1.函数 isNaN 接收参数后,会尝试将这个参数转换为数值,任何不能被转换为数值的的值都会返回 true,因此非数字值传入也会返回 true ,会影响 NaN 的判断。

2.函数 Number.isNaN 会首先判断传入参数是否为数字,如果是数字再继续判断是否为 NaN ,不会进行数据类型的转换,这种方法对于 NaN 的判断更为准确。

每日二省
为什么0.1+0.2 ! == 0.3,如何让其相等?

一个直接的解决方法就是设置一个误差范围,通常称为“机器精度”。对JavaScript来说,这个值通常为2-52,在ES6中,提供了Number.EPSILON属性,而它的值就是2-52,只要判断0.1+0.2-0.3是否小于Number.EPSILON,如果小于,就可以判断为0.1+0.2 ===0.3。

每日三省
== 操作符的强制类型转换规则?

1.首先会判断两者类型是否**相同,**相同的话就比较两者的大小。

2.类型不相同的话,就会进行类型转换。

3.会先判断是否在对比 null 和 undefined,是的话就会返回 true。

4.判断两者类型是否为 string 和 number,是的话就会将字符串转换为 number。

5.判断其中一方是否为 boolean,是的话就会把 boolean 转为 number 再进行判断。

6.判断其中一方是否为 object 且另一方为 string、number 或者 symbol,是的话就会把 object 转为原始类型再进行判断。

每日英语
Happiness is time precipitation, smile is the lonely sad.
幸福是年华的沉淀,微笑是寂寞的悲伤。