技术文章
你真的了解什么是计算机视觉吗?
什么是计算机视觉?
计算机视觉,英文Computer Vision,简称CV。计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等。
计算机视觉和机器视觉有何区别?
事实上,二者经常会被混淆,简单的说,二者最大的区别,在于技术要求的侧重点不一样,甚至差别很大。计算机视觉(CV),主要是对质的分析,比如分类识别,这是一个杯子那是一条狗;或者做身份确认,比如人脸识别,车牌识别;或者做行为分析,比如人员入侵或徘徊,人群聚集等。
机器视觉(MV),主要侧重对量的分析,比如通过视觉去测量一个零件的直径,一般来说,对准确度要求很高。
计算机视觉主要任务是什么?
计算机视觉的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的信息。计算机视觉任务的主要类型有以下几种:
❈ 物体检测
物体检测是视觉感知的第一步,也是计算机视觉的一个重要分支。物体检测的目标,就是用框去标出物体的位置,并给出物体的类别。
物体检测和图像分类不一样,检测侧重于物体的搜索,而且物体检测的目标必须要有固定的形状和轮廓。图像分类可以是任意的目标,这个目标可能是物体,也可能是一些属性或者场景。
❈ 物体识别(狭义)
计算机视觉的经典问题便是判定一组图像数据中是否包含某个特定的物体、图像特征或运动状态。这一问题通常可以通过机器自动解决,但是到目前为止,还没有某个单一的方法能够广泛的对各种情况进行判定:在任意环境中识别任意物体。
现有技术能够也只能够很好地解决特定目标的识别,比如简单几何图形识别、人脸识别、印刷或手写文件识别、车辆识别等,而且这些识别需要在特定的环境中,具有指定的光照、背景和目标姿态要求。
❈ 图像分类
一张图像中是否包含某种物体,对图像进行特征描述是物体分类的主要研究内容。一般说来,物体分类算法通过手工特征或者特征学习方法对整个图像进行全局描述,然后使用分类器判断是否存在某类物体。
图像分类问题就是给输入图像分配标签的任务,这是计算机视觉的核心问题之一。这个过程往往与机器学习和深度学习不可分割。
❈ 物体定位
如果说图像识别解决的是what,那么物体定位解决的则是where的问题,利用计算机视觉技术找到图像中某一目标物体在图像中的位置,即定位。
目标物体的定位对于计算机视觉在安防、自动驾驶等领域的应用有着至关重要的意义。
❈ 图像分割
在图像处理过程中,有时会需要对图像进行分割来提取有价值的用于后继处理的部分,例如筛选特征点,或者分割一或多幅图片中含有特定目标的部分等。
图像分割指的是将数字图像细分为多个图像子区域(像素的集合,也被称作超像素)的过程。图像分割的目的是简化或改变图像的表示形式,使得图像更容易理解和分析,更精确地说,图像分割是对图像中的每个像素加标签的一个过程,这一过程使得具有相同标签的像素具有某种共同视觉特性。
“图像语意分割”是一个像素级别的物体识别,即每个像素点都要判断它的类别,它和检测的区别是,物体检测是一个物体级别的,他只需要一个框,去框住物体的位置,而通常分割是比检测要更难的问题。
计算机视觉是通过创建人工模型来模拟本由人类执行的视觉任务,其本质是模拟人类的感知与观察的一个过程。这个过程不止识别,而是包含了一系列的过程,并且最终是可以在人工系统中被理解和实现的。