目标检测问题介绍

目标检测问题定义

目标检测是在图片中对可变数量的目标进行查找和分类。

image_1dki1ofkvs191a9dp4v1p6s1o5429.png-305.9kB

image_1dki1vcok1j6i1eq11elk1qq9129833.png-471.5kB

目标检测:不仅给出了矩形框(待检测对象)的位置,而且同时对于矩形框中的物体进行了分类,并使用不同颜色的矩形框表示不同的类别。

图像分类:主要是讲一幅图片作为输入,而将图片属于不同类别的概率分布作为输出。

无论是目标检测还是图像分类,在使用深度学习技术处理时,都需要完成特征提取这个环节。
对于传统的机器学习算法来说,我们通常会设计一些手动的特征来完成特征提取这个步骤。而对于深度学习来说,我们通常使用卷积神经网来完成特征提取的步骤。
目标检测和图像分类都属于计算机视觉领域中比较基础的研究,计算机视觉领域中其他的任务往往会依赖于这两个任务的结果进行后续的处理。例如,目标跟踪、单目标跟踪、多目标跟踪等等。

image_1dki38qbeog51oo31fle1t61oe93g.png-256.4kB

目标检测相对于目标分割而言,更加关注于语义层面的分割结果。
目标分割这属于更关注于像素级别处理的任务。所以针对目标检测和目标分割的模型,会有非常大的区别。

具体存在什么样的区别:

目标检测主要定位物体的位置,位置信息通常表示为一个矩形框,矩形框我们可以通过 4 维的数据来进行表示。而目标分割我们需要对每一个像素点进行类别的划分,此时,我们的结果就需要和原始的图片大小保持一致,因此,目标分割往往会采用上采样或反卷积等方式,得到和原始图像大小一致的输出结果。

Last modification:September 12, 2019
如果觉得我的文章对你有用,请随意赞赏