电子信息类论文:基于MRF的图像处理方法
所属栏目:播音与主持论文
发布时间:2011-02-26 10:04:45 更新时间:2011-02-26 10:04:45
摘要:介绍了马尔可夫随机场模型及其进行图像处理的方法,该方法主要包括三个阶段:学习阶段、计算阶段和处理阶段,并对这类方法的应用进行了展望。
关键字:马尔可夫随机场模型,吉布斯分布,OCR,模拟退火
AnApplicationofMRFModelforImagePreprocessing
YELing-weiZhangXin
(QingDaoBranchofNavalAeronauticalEngineeringInstitute,QingDao266041,China)
Abstract:ThispaperintroducesaMRFbasedalgorithmforpreprocessingimages.Thisapproachconsiststhreestages:trainingstage,computatingstageandprocessingstage.Atlastthefutureresearchworkislisted.
Keywords:MRF,Gibbsdistribution,OCR,Simulateannealing
1 马尔可夫随机场
马尔可夫随机场(MarkovRandomField,MRF)模型已经被广泛应用于图像处理并取得了很好的处理效果。在图像处理领域,马尔可夫随机场模型主要通过邻域和基团来建立图像象素之间的相关关系,再由Hammersley-Clifford定理与吉布斯分布相对应,因此若定义了吉布斯分布的能量函数,那么就可以确定一个马尔可夫随机场。
下面是一些马尔可夫随机场的相关概念[1]:
定义2.1(随机场)设(,F,P)为一概率空间,={1,2,…,l}为一指标集,B={0,1,…,m}为状态空间,随即变量(i,j∈Λ):(Ω,F,P)→B,称其全体X={;i,j∈Λ}为B上的随机场。
定义2.2(邻域)对于给定的指标集Λ,设N={;Λ×Λ,i,j∈Λ}为一集族,如果N满足(i,j)且当(i,)∈时有(,)∈,则称N为Λ×Λ上的邻域系,称为(i,j)的邻域。
最常用的邻域系有两种:
N={(i-1,j),(i+1,j),(i,j-1),(i,j+1)}
N={(i-1,j-1),(i-1,j),(i+1,j+1),(i+1,j-1),(i+1,j),(i,j+1),(i-1,j+1),(i-1,j)}
它们即为通常的4邻域和8邻域,这里分别称为一阶和二阶邻域系统。当(i,j)位于图的边缘或顶角处时,邻域的定义要作相应的改动。
定义2.3(基团)设N={N;i,j∈Λ}为一邻域系,A为某指标集,称集族C={;a∈A}是关于N的基团集,其满足:
(1)
(2)对于一切(,),(,)∈,则有。
点集位置的集合称为相对该邻域系的基团(clique)。
定义2.4(马尔可夫随机场)设X={;i,j∈Λ}是随机场,N={;i,j∈Λ}是一邻域,如果对一切(i,j)∈Λ×Λ,都有
则称X是关于邻域系N的马尔可夫随机场(MRF)。
关于马尔可夫随机场有下面重要的基本定理,即Hammersley-Clifford定理。
定理1设X={;i,j∈Λ}使关于邻域系N的马尔可夫随机场,C={;a∈A}是关于N的一个基团集,若对任何一个实现x={x;i,j∈Λ,x∈B},X的联合概率(密度)P(X=x)=具有下列形式:
式中,T为正常数;Z为归一化常数;U(x)称为能量函数,其具有如下表示:
U(x)=
函数只依赖于中那些点(,)的值,这种形式的分布称为C上的吉布斯(Gibbs)分布。反之,如果随机场X的联合分布具有上述的吉布斯分布形式,则X式关于N的马尔可夫随机场。
对于一阶邻域系={;i,j∈Λ},此时,
U(x)==
按定理及有关定义,只与及邻域象素有关,因此式(2.3)可进一步简化为
U(x)=++
只要规定三个函数V、V和V,就可以定义一个马尔可夫场。
2 基于马尔可夫随机场模型的图像处理
基于马尔可夫随机场的图像处理主要包括三个阶段:
1) 学习阶段:通过大量的训练样本建立观测模型并对先验概率进行学习;
2) 计算阶段:定义适当的能量公式采用模拟退火算法对模型参数进行优化计算;
3) 处理阶段:应用前两个阶段得到的模型对未知的图像进行处理。
在实验中,学习阶段是通过选择一定大小的邻域,统计大量质量较好的二值化图像的可能模式及其概率分布来完成的;计算阶段选用模拟退火算法对模型参数进行优化计算,得到一个优化模型;最后应用所得的优化模型对一些降质图像进行处理,修复残缺的文字。
2.1能量函数的定义
正如前一小节所述,马尔可夫随机场模型都符合吉布斯分布,不同模型之间的主要差别在于能量函数的定义,在这里我们应用了文献[2]中基于概率的定义,其中B与所取的邻域大小有关,为所取邻域中包含的象素数目。
(1)
2.2未知模式的概率统计
对于在学习阶段未出现的模式,通过与已知模式的比较来求得[2],计算公式如下:
(2)
式中,p为平滑因子,d(i,j)和u(i,j)分别为与之间不同和相同的象素数目,未知模式的能量计算公式为
(3)
式中,,为归一化因子。
2.3模拟退火算法
模拟退火算法[3](simulatedannealing,简称SA)是一种通用的优化算法。的思想最早是由Metropolis等(1953)提出的,1983年Kirkpatrick等将其组合优化。SA算法是基于MenteCarlo迭代求解策略的一种随机寻优算法,其出发点是基于物理中固体物体的退火过程与一般组合优化问题之间的相似性。模拟退火算法在某一初温下,伴随温度参数的不断下降,结合概率突跳特性在解空间中随机寻找目标函数的全局最优解,即在局部优解能概率性地跳出并最终趋于全局最优。
归纳言之,SA算法是基于MonteCarlo迭代求解策略的一种随机寻优算法,其出发点是基于物理退火过程与组合优化之间的相似性,SA由某一较高温度开始,利用具有概率突跳性的Metropolis抽样策略在解空间中进行随机搜索,伴随温度的不断下降重复抽样过程,最终得到问题的全局最优解。
模拟退火算法步骤描述如下:
1) 给定初温t=t,随机产生初始状态s=s,令k=0;
2) T(k)=t0×;
3) 产生新状态s=Genete(s);
4) Ifmin{1,exp[-(C(s)-C(s))/l]}random[0,1]s=s;
5) Until抽样稳定准则满足;
6) 退温=update()并令k=k+1;
7) Until算法终止准则满足;
8) 输出算法搜索结果。
其中,c是一个控制冷却速度的常量,在实验中,。
在模拟退火过程中,每一种模式的潜在的能量值在其修改前后都计算一次,是否接受修正值根据下式判断:,其中就是修正前后的能量差。如果,q>T,那么改变中心象素值是合理的,可以接受;但是如果q<1,那么这种改变就以一定概率接受。
3 结束语
本文对应用Markov随机场模型的方法进行了描述。进一步研究的工作:一是可以改进该方法在处理比较复杂的邻域关系,增大邻域大小无疑是一种解决方法,但是计算复杂度也会大大增加;二是应用该方法对文字图像、指纹图像等统计规律比较强的图像进行预处理,以减小后续的特征提取工作的难度。
参考文献
[1]. 孙即祥等.《模式识别中的特征提取与计算机视觉不变量》[M].国防出版社,2001年9月.
[2]. ChristianWolf,DavidDoermann.BinarizationofLowQualityTextusingaMarkovRandomFieldModel[J].IEEETrans,onPam2,2002,1051-1056.
[3]. 姚新,陈国良.模拟退火算法及其应用[J].计算机研究与发展,1990,7,1-6.
月期刊平台服务过的文章录用时间为1-3个月,依据20年经验,经月期刊专家预审通过后的文章,投稿通过率100%以上!