#1楼主:第一章 图像处理与分析的基本方法
文章发表于:2008-03-18 18:29
第一章 图像处理与分析的基本方法
由于汽车牌照识别系统的处理对象是从实地拍摄的含有车辆的图像,因此系统的关键技术几乎都是基于数字图像的处理和分析的,在设计系统时会用到一些图像处理的具体方法,本章将对其中一些基本方法予以简要介绍。
图像处理主要包括图像变换、图像增强、图像复原、区域分割等方法,对于一个图像分析处理环节,其输入的是原始图像,输出是经过处理后的图像,该图像应满足下一步图像识别的要求。在研究图像时,首先可对获得的图像信息进行预处理以除去噪声干扰,提高信噪比,并对图像进行几何校正、色彩校正等处理。当图像本身质量较差、有用信息微弱、无法辨识时,还得对其进行图像增强,图像增强的作用在于得到一幅满足一定要求的图像,或是对图像进行变换,以满足进一步分析的需要。为了从图像中寻找需要识别的对象,可对图像进行区域定位、分割,区分出背景与对象物。所谓图像复原就是将己经退化了的图像加以重建或恢复,以得到一个清晰的图像。在实际处理的时候,由于图像的信息量非常大,输入图像文件所占据的内存空间多,因此在图像处理、存储和传输时,还要对其进行编码压缩。由此可见,图像处理的目的主要在于解决两个问题:一是在一幅具有复杂背景的图像中,判断是否包含有用的信息,即是否有特定的对象物;二是确定并且提取出这些有用的信息,以用于下面图像识别环节。由于篇幅所限,这里只将在设计车辆牌照识别系统中,所用到的一些图像处理的基本方法,如,图像滤波、边缘检测等方法予以简要介绍。
§1.1 图像滤波
任何一幅未经处理的原始图像,都存在一定程度的噪声干扰.噪声恶化了图像质量,使图像模糊,有时甚至淹没处理对象的特征,给分析带来困难.消除图像噪声的工作称为图像平滑或滤波.平滑的目的有两个:改善图像质量和抽取对象特征.由于噪声源众多(如光栅扫描、底片颗粒、机械元件、信道传输等),噪声种类复杂(如加性噪声、乘性噪声、量化噪声等),所以平滑的方法也很多.平滑可以在空间域进行也可以在频率域进行.空间域常用方法有:邻域平均法、选择平均法、中值滤波、空间低通滤波.
邻域平均法是一种在空间域上对图像进行平滑处理的一种方法,易于实现,效果也好.选择法是以邻域平均法为基础的,它只对灰度值相同或相近的像素进行平均,或者照灰度特殊的程度加权之后再求和,以免造成目标边缘的模糊.中值滤波是一种非线性处理技术,能抑制图像中的噪声;它是基于图像的这样一种特性:噪声往往以孤立的点的形式出现,这些点对应的像素数很少,而图像则是由像素数较多、面积较大的小块构成.空间域低通滤波,由于图像中噪声空间相关性弱的性质,而图像本身的频率分量则处于较低的空间频率区域之内,因此可以用低通滤波的方法实现平滑,采用离散卷积可以实现滤波作用.限于篇幅,这里仅对毕设中所用到的中值滤波进行介绍。
中值滤波是一种非线性处理技术,能抑制图像中的噪声.它是基于图像的这样一种特性:噪声往往以孤立的点的形式出现,这些点对应的像素很少,而图像则是由像素数较多,面积较大的小块构成.
在二维的情况下,中值滤波器是一个含有奇数个像素的窗口.在处理之后,位于窗口正中的像素灰度值,用窗口内各像素灰度值的中值代替.其主要原理是:首先确定一个以某个像素为中心点的领域,一般为方形领域;然后将领域中的各个像素的灰度值进行排序,取其中间值作为中心点像素灰度的新值,这里的领域通常被称为窗口;当窗口在图像中上下左右进行移动后,利用中值滤波算法可以很好地对图像进行平滑处理。
具体步骤如下:
a)将模板在图像中漫游,并将模板中心与图像中
心某个像素的位置重合;
b)读取模板下各对应像素的灰度值;
c)将这些灰度值从小到大排列成一列;
d)找出排在中间的一个值;
e)将这个中间值赋给对应模板中心位置的像素。
中值滤波的输出像素是由领域图像的中间值决定的,因而中值滤波对极限象素值(与周围像素灰度值差别较大的像素)远不如平均值那么敏感,从而可以消除孤立的噪声点,又可以使图像产生较少的模糊。
通常,二维情况下的中值滤波可定义为:
式中:W为平面窗口尺寸;m为窗口水平尺寸;n为窗口垂直尺寸; 为被处理的图像平面上的一个象素点,坐标为(i,j); 为以 为中心、窗口W所套中范围内象素点灰度的中值,即中值处理的输出值; 为二维数据串的序号。
应用中值滤波的一种方法就是先试用长度为3的窗口对信号进行处理,若无明显信号损失再把窗口延长到5,对原图像作中值滤波,直到既有较好的噪声滤除的效果,又不过分损坏图像细节为止.还有一种方法就是对信号进行级联的中值滤波,采用固定的或可变长度的窗口一般地说,一次滤波不改变的区域,以后几次也将不变.小于窗宽的1/2的区域,每经一次滤波该区域将连续改变,一直进行到所得到信号的区间大于窗宽的1/2为止.
§1.2 边缘检测
通常从一幅复杂背景中提取对象物的边缘都是以原始图像为基础,检测图中每个象素点与其邻域内的灰度变化,利用边缘邻近的一阶或二阶方向导数的变化规律来检测出边缘,以达到从背景中分割出对象物的目的。边缘检测算法有如下四个步骤:滤波、增强、检测、定位。常用的边缘检测算子有:梯度算子、Sobel算子、Laplacian算子、Log算子,下面分别介绍。
1.2.1Roberts算子
梯度是一种利用局部差分算子寻找边缘的算子,对图像中的阶跃型的边缘,由于在边缘点处其一阶导数取极值,对数字图像f (i,j)中的每一个象素取其梯度值,
取适当的阈值 ,若 > ,则(i,j)点为阶跃状的边缘点, 成为梯度算子的边缘图像。梯度算子有如下两种近似计算方法,
1:
2:
该是也称为Roberts算子。
1.2.2 Sobel 算子
Sobel算子是滤波算子的形式,对数字图像f (i, j)的每一个象素点,考察其邻点灰度值的加权差,与之接近的邻点的权大。以此定义Sobel算子如下,
S(i,j)=
/(f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1))-(f(i+1,j-1)+2f(i+1,j)+f(i+1,j+1))/
+/(f(i-1,j-1)+2f(i,j-1)+f(I+1,j-1))-(f(i+1,j+1)+2f(i,j+1)+f(i+1,j+1))/
取适当的阈值 ,若 ,则(i,j)点为阶跃的边缘点, 为边缘图像。经大量实验表明,利用Roberts算子提取边缘的结果比较粗糙,而Sobel算子对边缘的定位比较准确,这也是Sobel算子能得到广泛应用的原因。
1.2.3 Laplacian 算子
Laplacian算子是一种二阶边缘检测方法。它通过寻找图像灰度中的二阶微分中的过零点来检测边缘点。其原理为:对阶跃边缘,二阶倒数在边缘出为零,而在边缘点的两侧二阶倒数取异号,因此,对数字图像f(i,j)的每个象素取其关于横轴方向和纵轴方向的二阶查分之和,从而构成Laplacian算子:
L (i, j) =f (i+l, j) +f (i-1,j)+f(i,j+l) +f (i, j-1) -4f (i, j)
Laplacian算子是一个与边缘方向无关的边缘检测算子。
1,2,4 Log算子
由Marr和Hildreth提出的拉普拉斯边缘检测算子 被誉为最佳边缘检测器之一。该算子的特点是利用高斯滤波器对图像进行平滑。是一种带滤波器的Laplacian算子。
其中,二维高斯滤波器的相应函数为
设I(x,y)为灰度图像函数,由线性系统中卷积和微分的可交换性,
得:
即:对图像的高斯平滑滤波与拉普拉斯微分运算可结合成一个卷积算子如下:
其中:
用上述算子卷积图像,通过判断符号的变化所确定出零交叉点的位置,就是边缘点。此方法又称LOG算法(Laplacian-of-Gaussian Algorithm)。利用厅 的可分解性,对图像的二维卷积可简化为两个一维卷积如下:
其中
由此可见滤波(通常是平滑)、增强、检测这三个边缘检测步骤对使用Log边缘检测仍然成立,其中平滑是用高斯滤波器来完成的;增强是将边缘转换成零交叉点来实现的;边缘检测则是通过检测零交叉点来进行的.
§1.3 数学形态学
数学形态学是一门综合了多学科知识的交叉科学,涉及微分几何、积分几何、泛函分析和随机过程等许多数学理论,是一种应用于图像处理和模式识别领域的新的方法。
数学形态学的数学基础和所用语言是集合论,因此它具有完备的数学基础,这为形态学用于图像分析和处理、形态滤波器的特性分析和系统设计奠定了坚实的基础。数学形态学的应用可以简化图像数据,保持它们基本的形状特性,并除去不相干的结构。数学形态学的算法具有天然的并行实现的结构, 实现了形态学分析和处理算法的并行,大大提高了图像分析和处理的速度。
数学形态学是由一组形态学的代数运算子组成的,它的基本运算有4个: 膨胀(或扩张)、腐蚀(或侵蚀)、开启和闭合, 它们在二值图像和灰度图像中各有特点。基于这些基本运算还可推导和组合成各种数学形态学实用算法,用它们可以进行图像形状和结构的分析及处理,包括图像分割、特征抽取、边界检测、 图像滤波、图像增强和恢复等。数学形态学方法利用一个称作结构元素的“探 针”收集图像的信息,当探针在图像中不断移动时, 便可考察图像各个部分之间的相互关系,从而了解图像的结构特征。数学形态学基于探测的思想,与人的FOA(Focus Of Attention)的视觉特点有类
似之处。作为探针的结构元素,可直接携带知识(形态、大小、甚至加入灰度和色度信息)来探测、研究图像的结构特点。
1.3.1 数学形态学基本概念
数学形态学理论基础艰深,但其基本概念比较简单,数学形态学是建立在集合论基础上的代数系统,提出了一套独特的变换和概念用于描述图像的基本特征。用数学形态学对图像进行处理,主要是通过构造出适合图像分析要求的结构元素,对图像进行各种形态变换,使变换后的图像突出某些有用的信息。
集合论是数学形态学的基础,所以首先对集合论的一些基本概念作概括介绍。
1、集合
具有某种性质的确定的有区别的事物的全体。如果某种事物不存在,成为空集。
2、元素
构成集合的每一个事物称之为元素。设有一幅图像X,若点a在X的区域以内,则称a为X的元素,记作a Xo
3、平移转换
设有欧式空间V,A是V中的一个二维集合,A中的元素为
,定义 ,则对集合A的平移转换为: 。
4、补集
集合A补集为 。
5、结构元素
在形态学中,结构元素是最重要的基本概念。其定义为:设n维欧式空间V,结构元素B是V或其子空间上的一个集合,具有一定的几何形状,可以是圆、矩形、有向点等。结构元素B比物体要小的多,通过移动结构元素,考察图像各个部分之间的关系。即结构元素是在考察目标图像各部分之间的关系时,需要设计一种收集信息的“探针”。
1.3.2 形态变换
膨胀与腐蚀是两种最基本的形态变换。其定义如下:
1、 膨胀
设A、B均为欧式空间的集合,B为结构元素,A被B膨胀的
结果为以下点集: ,即B被所有x平移后与A至少有一个非零的公共元素。
2、 腐蚀
A被B腐蚀的结果为以下点集: ,即A被B腐蚀的结果为所有使B被x平移后包含于A的点的集合。
由膨胀、腐蚀运算可以复合构成数学形态学的另外两种变换:开运算、闭运算。
3、 开运算
设A是原始图像,B是结构元素,集合A被B作开运算,记为
,即A被B腐蚀后的结果再被B膨胀。
4、 闭运算
设A是原始图像,B是结构元素,集合A被B作闭运算,记为 ,即A被B膨胀后的结果再被B腐蚀。
开、闭运算一般可以平滑图像的轮廓,不同的是;开运算具有消除图像上细小物体并在物体影像纤细处(目标狭窄区)分离物体和平滑较大物体边界的作用;闭运算具有填充物体影像内细小空洞,连接邻近物体和平滑边界的作用。
5、击中(Hit)击不中(Miss)变换
形态学中击中击不中变换是形状检测的基本工具。设有幅图像A,结构元素B, B=(B1, B2),其中B1是由和目标相关的B的元素形成的集合,而B2是由和相应的背景相关的B的元素集答,B1在A中找到一个匹配,B2在 中找到一个匹配。则称B击中A,记为:
。
1.3.3基本形态学算法
当处理二值图像时,形态学的主要应用是提取表示和描述图像形状的有用成份。特别是用形态学方法提取某一区域的边界线、连接成份、骨骼、凸壳的算法是十分有效的。此外,区域填充、细化、加粗、裁剪等处理方法也经常与上述算法相结合在预处理和后处理中使用。
1、边缘提取算法
设图像为A,结构元素为B,图像边缘为 ,则提取边缘的算法为: ,即集合A与A被B腐蚀的结果的差为图像的边缘。
2、细化
集合A被结构元素的细化用 表示,根据击中(或击不中)变换定义:
对称细化A的一个更有用的表达是基于结构序列{B}={B1,B2,B3,…,Bn},其中Bi是 的旋转。根据这个概念,定义被一个结构元素序列的细化为 ,这个过程是用尽细化A,然后用 细化前一步细化的结果等等,直到A被B细化。整个过程重复进行到没有进一步的变化发生为止。