搜档网
当前位置:搜档网 › SAR图像自动目标提取方法研究

SAR图像自动目标提取方法研究

SAR图像自动目标提取方法研究
SAR图像自动目标提取方法研究

SAR图像自动目标提取方法研究

合成孔径雷达(Synthetic Aperture Radar,SAR),由于具有全天时、全天候的工作特点,成为目前一种不可或缺的遥感观测手段,在军事和民用领域得到了广泛的发展。SAR图像自动目标提取是其应用的重要方向之一,该技术的研究近年来受到国内外学者的广泛关注。

本论文以发展实用化的SAR图像自动目标提取技术为目的,结合自动目标提取相关理论和应用背景,针对其中的复杂场景SAR图像目标检测、复杂场景SAR 图像目标鉴别和面向鉴别特征提取的目标切片图像分割问题,展开系统的分析和研究,具体内容如下:第一部分,研究了多目标和杂波边界等复杂场景SAR图像中的目标检测问题。对于复杂场景中的目标检测问题,背景参考窗内均匀同质杂波像素的筛选是问题解决的关键,通常采用像素筛选或半窗筛选的策略实现。

通过比较传统像素筛选类和半窗筛选类检测算法的各自优势,在背景杂波服从G~0分布模型假设下,提出了一种基于自动区域筛选的恒虚警率(Constant False Alarm Rate,CFAR)目标检测算法。该算法首先将局部参考窗均匀划分成若干个区域块;然后利用变化指数统计量对局部参考窗内的参考区域进行筛选,以剔除其中具有异质像素干扰的非均匀区域;接着利用均值比统计量对参考窗内的同质均匀区域进行合并,以解决杂波边界处的背景杂波筛选问题;最后利用筛选获得的均匀同质区域内的杂波像素对背景杂波的统计模型进行参数估计,进而实现待检测区域内像素的目标检测。

第二部分,从图像超像素分割角度出发,进一步研究了复杂场景SAR图像中的目标检测问题。随着SAR图像分辨率的逐渐提高,目标在图像上的形状结构越来越清晰。

图像超像素分割通过将图像邻域内具有相似特征的像素进行聚类,从而能够实现这种形状结构在图像上的有效提取。此外,以超像素代替像素作为图像的最小处理单元,不仅能够提高后续检测方法的计算效率,还能够提高其最终的检测性能。

工作主要有以下两点:(1)在SAR图像局部区域杂波服从Gamma分布假设下,提出了一种SAR-SEEDS超像素分割算法。该算法首先以均匀网格划分作为图像初始超像素分割;然后以超像素分割的能量评估函数为判决准则,在图像层级结构中对超像素边缘进行迭代修正。

SAR-SEEDS算法首先在大尺度层对超像素进行边缘更新,实现超像素边缘的粗修正;然后逐步降低尺度;最后在像素层进行边缘更新,实现超像素边缘的精细修正。该层级结构边缘更新方式,不仅能在一定程度上避免算法陷入局部最优解,同时还能有效地提升算法的收敛速度。

(2)以SAR图像超像素分割预处理为基础,在背景杂波服从G~0分布模型假设下,提出了一种基于超像素筛选与合并的CFAR目标检测算法。算法通过以下几个步骤实现SAR图像的目标检测:首先,利用SAR-SEEDS超像素分割算法对待检测图像进行超像素分割,实现图像局部均匀区域划分;其次,利用超像素筛选算法将图像中的超像素分为背景类超像素和潜在目标类超像素;然后,在待检测超像素的局部参考窗内,利用区域合并技术对其中的背景类超像素进行区域合并,实现背景区域的图像分割;接着,根据参考窗内背景类超像素区域的图像分割结果,选择待检测超像素的参考背景杂波区域,并确定检测阈值,实现超像素的目标检测;最后,再次利用区域合并技术对被检测为目标的超像素进行合并,进而获得最终的图像目标级的检测结果。

第三部分,研究了复杂场景SAR图像中的目标鉴别问题。考虑到目标和杂波切片图像中局部结构特征分布的不同,提出了一种基于多特征融合词包(Bag of Words,BOW)模型的SAR图像目标鉴别算法。

在BOW模型底层特征提取阶段,算法采用SAR-SIFT特征描述局部区域的形状信息;同时,采用基于传统鉴别特征提出的一组SAR图像局部特征来描述局部区域的对比度信息和纹理信息。对于BOW模型中多个底层特征的融合,算法采用图像层的特征融合方式生成图像的全局鉴别特征,其中各单底层特征BOW模型特征的权系数通过L2范数约束的多核学习(Multiple Kernel Learning,MKL)方法训练得到。

第四部分,研究了SAR目标切片图像分割问题。在SAR目标切片图像分割问题中,背景杂波区域和目标散射区域的像素幅值一致性对图像分割质量具有直接的影响。

基于此,提出了一种基于幂次变换的SAR图像Otsu分割算法。算法首先对SAR图像进行相干斑滤波,通过邻域平滑处理提高背景区域和目标区域的像素幅值一致性;然后自适应地选取变换幂次,对滤波后的SAR图像做幂次变换,以进一步增强目标区域的像素幅值一致性;最后直接利用一维Otsu分割算法对变换后的图像进行分割处理。

图像特征提取方法

图像特征提取方法 摘要 特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。 至今为止特征没有万能和精确的图像特征定义。特征的精确定义往往由问题或者应用类型决定。特征是一个数字图像中“有趣”的部分,它是许多计算机图像分析算法的起点。因此一个算法是否成功往往由它使用和定义的特征决定。因此特征提取最重要的一个特性是“可重复性”:同一场景的不同图像所提取的特征应该是相同的。 特征提取是图象处理中的一个初级运算,也就是说它是对一个图像进行的第一个运算处理。它检查每个像素来确定该像素是否代表一个特征。假如它是一个更大的算法的一部分,那么这个算法一般只检查图像的特征区域。作为特征提取的一个前提运算,输入图像一般通过高斯模糊核在尺度空间中被平滑。此后通过局部导数运算来计算图像的一个或多个特征。 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。当光差图像时,常 常看到的是连续的纹理与灰度级相似的区域,他们相结合形成物体。但如果物体的尺寸很小 或者对比度不高,通常要采用较高的分辨率观察:如果物体的尺寸很大或对比度很强,只需 要降低分辨率。如果物体尺寸有大有小,或对比有强有弱的情况下同事存在,这时提取图像 的特征对进行图像研究有优势。 常用的特征提取方法有:Fourier变换法、窗口Fourier变换(Gabor)、小波变换法、最 小二乘法、边界方向直方图法、基于Tamura纹理特征的纹理特征提取等。

设计内容 课程设计的内容与要求(包括原始数据、技术参数、条件、设计要求等):一、课程设计的内容 本设计采用边界方向直方图法、基于PCA的图像数据特征提取、基于Tamura纹理特征的纹理特征提取、颜色直方图提取颜色特征等等四种方法设计。 (1)边界方向直方图法 由于单一特征不足以准确地描述图像特征,提出了一种结合颜色特征和边界方向特征的图像检索方法.针对传统颜色直方图中图像对所有像素具有相同重要性的问题进行了改进,提出了像素加权的改进颜色直方图方法;然后采用非分割图像的边界方向直方图方法提取图像的形状特征,该方法相对分割方法具有简单、有效等特点,并对图像的缩放、旋转以及视角具有不变性.为进一步提高图像检索的质量引入相关反馈机制,动态调整两幅图像相似度中颜色特征和方向特征的权值系数,并给出了相应的权值调整算法.实验结果表明,上述方法明显地优于其它方法.小波理论和几个其他课题相关。所有小波变换可以视为时域频域的形式,所以和调和分析相关。所有实际有用的离散小波变换使用包含有限脉冲响应滤波器的滤波器段(filterbank)。构成CWT的小波受海森堡的测不准原理制约,或者说,离散小波基可以在测不准原理的其他形式的上下文中考虑。 通过边缘检测,把图像分为边缘区域和非边缘区域,然后在边缘区域内进行边缘定位.根据局部区域内边缘的直线特性,求得小邻域内直线段的高精度位置;再根据边缘区域内边缘的全局直线特性,用线段的中点来拟合整个直线边缘,得到亚像素精度的图像边缘.在拟合的过程中,根据直线段转角的变化剔除了噪声点,提高了定位精度.并且,根据角度和距离区分出不同直线和它们的交点,给出了图像精确的矢量化结果 图像的边界是指其周围像素灰度有阶跃变化或屋顶变化的那些像素的集合,边界广泛的存在于物体和背 景之间、物体和物体之间,它是图像分割所依赖的重要特征.边界方向直方图具有尺度不变性,能够比较好的 描述图像的大体形状.边界直方图一般是通过边界算子提取边界,得到边界信息后,需要表征这些图像的边 界,对于每一个边界点,根据图像中该点的梯度方向计算出该边界点处法向量的方向角,将空间量化为M级, 计算每个边界点处法向量的方向角落在M级中的频率,这样便得到了边界方向直方图. 图像中像素的梯度向量可以表示为[ ( ,),),( ,),)] ,其中Gx( ,),),G ( ,),)可以用下面的

关于图像特征提取

关于图像特征提取 特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。 特征的定义 至今为止特征没有万能和精确的定义。特征的精确定义往往由问题或者应用类型决定。特征是一个数字图像中“有趣”的部分,它是许多计算机图像分析算法的起点。因此一个算法是否成功往往由它使用和定义的特征决定。因此特征提取最重要的一个特性是“可重复性”:同一场景的不同图像所提取的特征应该是相同的。 特征提取是图象处理中的一个初级运算,也就是说它是对一个图像进行的第一个运算处理。它检查每个像素来确定该像素是否代表一个特征。假如它是一个更大的算法的一部分,那么这个算法一般只检查图像的特征区域。作为特征提取的一个前提运算,输入图像一般通过高斯模糊核在尺度空间中被平滑。此后通过局部导数运算来计算图像的一个或多个特征。 有时,假如特征提取需要许多的计算时间,而可以使用的时间有限制,一个高层次算法可以用来控制特征提取阶层,这样仅图像的部分被用来寻找特征。 由于许多计算机图像算法使用特征提取作为其初级计算步骤,因此有大量特征提取算法被发展,其提取的特征各种各样,它们的计算复杂性和可重复性也非常不同。 边缘 边缘是组成两个图像区域之间边界(或边缘)的像素。一般一个边缘的形状可以是任意的,还可能包括交叉点。在实践中边缘一般被定义为图像中拥有大的梯度的点组成的子集。一些常用的算法还会把梯度高的点联系起来来构成一个更完善的边缘的描写。这些算法也可能对边缘提出一些限制。 局部地看边缘是一维结构。 角 角是图像中点似的特征,在局部它有两维结构。早期的算法首先进行边缘检测,然后分析边缘的走向来寻找边缘突然转向(角)。后来发展的算法不再需要边缘检测这个步骤,而是可以直接在图像梯度中寻找高度曲率。后来发现这样有时可以在图像中本来没有角的地方发现具有同角一样的特征的区域。 区域 与角不同的是区域描写一个图像中的一个区域性的结构,但是区域也可能仅由一个像素组成,因此许多区域检测也可以用来监测角。一个区域监测器检测图像中一个对于角监测器来说太平滑的区域。区域检测可以被想象为把一张图像缩小,然后在缩小的图像上进行角检测。 脊 长条形的物体被称为脊。在实践中脊可以被看作是代表对称轴的一维曲线,此外局部针对于每个脊像素有一个脊宽度。从灰梯度图像中提取脊要比提取边缘、角和区域困难。在空中摄影中往往使用脊检测来分辨道路,在医学图像中它被用来分辨血管。 特征抽取 特征被检测后它可以从图像中被抽取出来。这个过程可能需要许多图像处理的计算机。其结果被称为特征描述或者特征向量。 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 一颜色特征 (一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特

图像轮廓线提取

数学实验报告 实验二图像轮廓线提取技术 学院 专业 姓名 学号 成绩单序号 提交日期

一、实验目的 1.了解对matlab的图像处理功能,掌握基本的图像处理方式; 2.掌握imread,imshow,imwrite,subplot,title等的基本使用方法。 3.掌握图像轮廓线提取的简单方法并上机实现。 4.了解matlab自带的边界检测算子的使用,提高对复杂图像处理的能力。 二、实验要求 1.任意选取一幅灰度图像和一幅彩色图像,对算法中若干关键语句中进行调整,得出不同的实验结果,对这些结果进行分析,并与MATLAB自带的边缘检测做对比。 2.提出其它的轮廓线提取方法,与简单阈值法进行比较分析。 三、实验过程 1.任意选取一幅灰度图像和一幅彩色图像,对算法中若干关键语句中进行调整,得出不同的实验结果,对这些结果进行分析。 ⑴灰度图的轮廓线提取,M文件代码: function gray(pix,n) %灰度图的轮廓线提取 A=imread(pix); %读取指定的灰度图%生成与图像对应的矩阵 [a,b]=size(A); %a,b分别等于矩阵A的行数和列数 B=double(A); %将矩阵A变为双精度矩阵 D=40*sin(1/255*B); %将矩阵B进行非线性变换 T=A; %新建与A同等大小矩阵 for p=2:a-1 %处理图片边框内的像素点 for q=2:b-1 if (D(p,q)-D(p,q+1))>n|(D(p,q)-D(p,q-1))>n|(D(p,q)-D(p+1,q))>n|(D(p,q)-D(p-1,q))>n|( D(p,q)-D(p-1,q+1))>n|(D(p,q)-D(p+1,q-1))>n|(D(p,q)-D(p-1,q-1))>n|(D(p,q)-D(p+1,q +1))>n T(p,q)=0; %置边界点为黑色%新建轮廓线矩阵 else T(p,q)=255; %置非边界点为白色 end; end; end; subplot(2,1,1); %将窗口分割为两行一列,下图显示于第一行 image(A); %显示原图像 title('灰度图原图'); %图释 axis image; %保持图片显示比例 subplot(2,1,2); %下图显示于第二行 image(T); %显示提取轮廓线后的图片

图像分割和特征提取技术研究

毕业设计 图像分割和特征提取技术研究 摘要 图像分割是图像分析的第一步,是图像理解的重要组成部分,在有关图像处理的几乎所有领域具有广泛的应用。因此,图像分割一直受到高度重视,对其研究具有十分重要的意义。长期以来,研究人员提出了许多实用的分割算法。随着统计学理论,神经网络,小波理论等在图像分割中的应用日益广泛,遗传算法、尺度空间、非线性扩散方程等近期涌现的新方法和新思想也不断被用于解决分割问题,许多国内外学者也针对一些具体应用提出了许多实用有效的方法。 本文介绍了数字图像处理技术中图像分割技术的基本理论和三种图像分割方法(1)基于阈值图像分割;(2)基于边缘检测及算子分割;(3)基于区域特性的图像分割。对基于点的分割方法进行了较全面的叙述,主要研究了图像分割方法中的边缘检测法,区域提取法和阈值分割法。通过大量的理论研习。并编写了MATLAB软件程序,对各分割方法进行了仿真实验,得到分割图像。最后对于仿真进行了数据处理分析,验证了Canny算子的整体效果最好, Prewitt算子分割细致。但对于一幅图像仅仅只有只用一种方法达不到很好的效果,而根据待分割图象的不同特点,结合已知的先验知识,研究符合具体图象特性的分割模型,才是提高图象分割的重要手段。 关键词:图像分割;边缘法;区域法;阈值法;分水岭分割法

Lmage Segmentation And Feature Extraction Technology Research Abstract Image segmentation is the first step in image analysis, image segmentation is an important component of image understanding, in almost all areas of the image processing has widely application. As a result, image segmentation has been attached great importance to, its research has the very vital significance. For a long time,researchers put forward many practical segmentation algorithm. With statistics theory, the neural network, wavelet theory has been used increasingly in image segmentation, such as genetic algorithm, scale space, and nonlinear diffusion equation with the recent emergence of new methods and new ideas are constantly being used to solve the segmentation problem, many scholars at home and abroad for some specific application put forward many practical and effective method. Digital image processing techniques were introduced in This paper introduces the digital image processing technology of image segmentation technology in basic theory and three methods of image segmentation. (1) based on threshold image segmentation. (2) segmentation based on edge detection and operator; (3) the image segmentation based on region feature. On the segmentation method based on the point of narrative, mainly studies the edge of image segmentation method, region extraction method and threshold segmentation method. Through a lot of theory study. And write the MATLAB software, the segmentation method, the simulation experiment for image segmentation. Finally analyzed the data processing for simulation.Verify the Canny operator of the overall effect is best. Prewitt operator segmentation and detailed. But for an image only only one way to reach a good effect, and according to the different characteristics of for image segmentation, combined with the known prior knowledge, research in accordance with the specific image segmentation model, is an important means to improve the image segmentation. KEYWORDS:Segmentation;edge method;the regional method;threshold;watershed segmentation

图像特征提取总结

图像常见特征提取方法简介 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 一、颜色特征 (一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布的信息。 (二)常用的特征提取与匹配方法 (1)颜色直方图 其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。 最常用的颜色空间:RGB颜色空间、HSV颜色空间。 颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。 (2)颜色集 颜色直方图法是一种全局颜色特征提取与匹配方法,无法区分局部颜色信息。颜色集是对颜色直方图的一种近似首先将图像从RGB颜色空间转化成视觉均衡的颜色空间(如HSV 空间),并将颜色空间量化成若干个柄。然后,用色彩自动分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一个二进制的颜色索引集。在图像匹配中,比较不同图像颜色集之间的距离和色彩区域的空间关系 (3)颜色矩 这种方法的数学基础在于:图像中任何的颜色分布均可以用它的矩来表示。此外,由于颜色分布信息主要集中在低阶矩中,因此,仅采用颜色的一阶矩(mean)、二阶矩(variance)和三阶矩(skewness)就足以表达图像的颜色分布。 (4)颜色聚合向量 其核心思想是:将属于直方图每一个柄的像素分成两部分,如果该柄内的某些像素所占据的连续区域的面积大于给定的阈值,则该区域内的像素作为聚合像素,否则作为非聚合像素。(5)颜色相关图 二纹理特征 (一)特点:纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局部的偏差而无法匹配成功。作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力。但是,纹理特征也有其缺点,一个很明显的缺点是当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。另外,由于有可能受到光照、反射情况的影响,从2-D图像中反映出来的纹理不一定是3-D物体表面真实

CCD图像的轮廓特征点提取算法

第33卷第4期电子科技大学学报V ol.33 No.4 2004年8月Journal of UEST of China Aug. 2004 CCD图像的轮廓特征点提取算法 侯学智,杨平,赵云松 (电子科技大学机械电子工程学院成都 610054) 采用最大方差法将图像二值化,用图像形态学的梯度细化和修剪算法来提取边缘轮廓,利用十一【摘要】﹑ 点曲率法得到轮廓的角点和切点的大致位置。提出了一种基于最小二乘拟合的改进算法,来进一步确定角点和切点,并对轮廓分段识别。该算法应用在基于图像处理的刀具测量系统中,实际结果表明具有良好的抗噪声性能,能准确提取出图像的特征点。 关键词刀具测量; 细化; 曲率; 最小二乘拟合; 角点 中图分类号TP391 文献标识码 A Contour Feature Point Detection Algorithm of CCD Image Hou Xuezhi,Yang Ping,Zhao Yunsong (School of Mechatronic Engineering, UEST of China Chengdu 610054) Abstract The image is segmented to Bi-value image with max variance algorithm, and then the edge is detected by a series of image morphology algorithm including grads, thinning and cutting. The eleven point curvature-computing method is used to locate the area of corner and point of tangency. An improved algorithm based on least square fitting is given to search corner and point of tangency. This algorithm is applied to the cutting tools measurement system based on image processing and the actual result proves it has a good noise-resisted performance and can detect feature points accurately. Key words cutting tools measurement; thinning; curvature; least square fitting; corner 目前数控加工精度已达到微米级,对刀精度要求愈来愈高。传统的刀具测量方式采用人眼瞄准,容易带来主观误差,使对刀精度降低。在基于图像处理的刀具测量系统中,CCD数码相机将对刀状态的图像摄入,通过USB接口输入计算机。首先提取出刀具轮廓的特征点,再对轮廓曲线进行分段,从而测量刀具的长度﹑半径﹑角度等参数。通常利用曲率信息来提取轮廓特征点,三点曲率法对噪声较敏感,十一点曲率法能较好地估算出轮廓的曲率,并能简单提取出轮廓的角点与切点区域[1, 2]。本文提出利用最小二乘法拟合角点和切点区域的曲线,根据计算的斜率和曲率的特点能有效确定角点和切点。 1 图像预处理 被测刀具的图像如图1所示。CCD相机采集到刀具的彩色图像,将其转化为256色的灰度图像,如图1a 所示,采用最大方差阈值法将图像二值化。由于刀具表面存在油污,光线散射等原因,图像二值化后,在刀具部分有颗粒状噪声,而刀具以外有细小孔洞存在,所以在提取轮廓前,采用形态学算子滤波。在图像形态学中,最基本的运算是腐蚀和膨胀运算,通过腐蚀和膨胀可以构成开运算与闭运算。开闭运算都能够平滑边缘,其中开运算能够消除细小物体,闭运算能够填充物体孔洞。本文采用方形结构元素,对图像先闭运算后开运算,有效地滤除了图像的细小孔洞和噪声,而刀具的结构和面积基本保持不变。图1b所示为 收稿日期:2003 ? 07 ? 24 作者简介:侯学智(1980 ? ),男,硕士生,主要从事工业测控技术方面的研究.

图像语义分析与理解综述

*国家自然科学基金资助项目(N o .60875012,60905005) 收稿日期:2009-12-21;修回日期:2010-01-27 作者简介 高隽,男,1963年生,教授,博士生导师,主要研究方向为图像理解、智能信息处理、光电信息处理等.E m a i:l gao j un @hfut .edu .cn .谢昭,男,1980年生,博士,讲师,主要研究方向为计算机视觉、智能信息处理、模式识别.张骏,女,1984年生,博士研究生,主要研究方向为图像理解、认知视觉、机器学习.吴克伟,男,1984年生,博士研究生,主要研究方向为图像理解、人工智能. 图像语义分析与理解综述 * 高 隽 谢 昭 张 骏 吴克伟 (合肥工业大学计算机与信息学院合肥 230009) 摘 要 语义分析是图像理解中高层认知的重点和难点,存在图像文本之间的语义鸿沟和文本描述多义性两大关键问题.以图像本体的语义化为核心,在归纳图像语义特征及上下文表示的基础上,全面阐述生成法、判别法和句法描述法3种图像语义处理策略.总结语义词汇的客观基准和评价方法.最后指出图像语义理解的发展方向.关键词 图像理解,语义鸿沟,语义一致性,语义评价中图法分类号 T P 391.4 I m age Se m antic Anal ysis and Understandi ng :A R eview GAO Jun ,XI E Zhao ,Z HANG Jun ,WU Ke W ei (S chool of C o m puter and Infor m ation,H e fei University o f T echnology,H efei 230009) ABSTRACT Se m antic ana l y sis is the i m portance and diffi c u lty of high level i n terpretati o n i n i m age understandi n g ,i n wh ich there are t w o key issues of text i m age se m an tic gap and tex t descri p ti o n po lyse m y .Concentrating on se m antizati o n o f i m ages onto logy ,three soph i s tica ted m et h odolog ies are round l y rev ie w ed as generati v e ,d iscri m ina ti v e and descriptive gra mm ar on the basis of conc l u d i n g i m ages se m antic fea t u res and context expression .The ob jective benchm ark and eva l u ation for se m an tic vocabu lary are i n duced as w e l.l F i n ally ,the summ arized directions fo r furt h er researches on se m antics i n i m age understand i n g are discussed i n tensively .K ey W ords I m age Understanding ,Se m antic G ap ,Se m an tic Consistency ,Se m an tic Evalua ti o n 1 引 言 图像理解(I m age Understandi n g ,I U )就是对图像的语义解释.它是以图像为对象,知识为核心,研 究图像中何位置有何目标(what is w here)、目标场景之间的相互关系、图像是何场景以及如何应用场景的一门科学.图像理解输入的是数据,输出的是知 识,属于图像研究领域的高层内容[1-3] .语义(Se 第23卷 第2期 模式识别与人工智能 V o.l 23 N o .2 2010年4月 PR &A I A pr 2010

基于直线检测算法的卫星图片中建筑物轮廓提取

收稿日期:2007-11-22;修回日期:2008-01-15。 作者简介:庞池海(1982-),男,浙江天台人,硕士研究生,主要研究方向:计算机仿真、图像处理; 李光耀(1965-)男,安徽安庆人,研究员,博士生导师,主要研究方向:计算机仿真、图像处理; 赵洁(1983-),女,江苏南通人,硕士研究生,主要研究方向:计算机仿真、图像处理;朱恒晔(1978-),男,江苏镇江人,博士,主要研究方向:系统仿真、虚拟样机。 文章编号:1001-9081(2008)S1-0190-03 基于直线检测算法的卫星图片中建筑物轮廓提取 庞池海,李光耀,赵 洁,朱恒晔 (同济大学CAD 研究中心,上海201804) (tcp ch @sohu .com ) 摘 要:提出一种方法,可以从卫星图像中自动检测建筑物。介绍了直线提取和直线合并的算法,分别讨论算法的实现结果和对结果的评价。建筑物检测的结果为矢量的二维候选数据,缩短了原始图像数据和最后对图像理解之 间的差距。 关键词:建筑物检测;直线检测;Canny 算子;霍夫变换;边缘检测中图分类号:T P391.41 文献标志码:A Buildi ng figure extracti on i n satellite i m ages based on li ne detecti on algorithm PANG Ch-i ha,i LI Guang -yao ,Z HAO Jie ,ZHU H eng -ye (CAD Re se a rch C e n te r,T ongji Universit y,S hangha i 201804,C hina ) Abstract :In o rder to g enerate t he 3D-model of constructi on ,usi ng t he m ethod based on i m ag e pro cessi ng,au t om ated techn i ques w ere proposed to replace the curren t manua l work .A n approach for auto m atic bu ildi ng detection w as put for w ard from sate llite i m agery .F irstl y,the algo rith m s o f li ne ex tracti on and li ne m erg i ng w ere presen ted .T hen ,t he i m p l ementation of the m e t hod and resu lt quantitative qua lity assess m ent we re discussed respecti ve l y .The resu lt of bu il d i ng detecti on prov i des the vector i a l and t w o -di m ens i on cand i date data ,w hich sho rten the d ifference be t w een or i g i na l i m ag e data and fi nal understandi ng . K ey words :buil d i ng detection ;li ne de tecti on ;C anny opera t o r ;H ough transf o r m;edge detection 0 引言 从城市航空影像中提取关键地物的研究主要集中于建筑 物和道路两个方面。已有的匹配的方法,对于现代城市中具有重要意义且形状复杂的高层建筑物和主干道,还不能形成有效的提取。 然而人类却能几乎在瞬间辨识出这些物体的存在和位置[1] 。航空影像的复杂性使目标检测变得十分困难。以往对建筑的检测方法可以分为以下3类:1)使用立体影像匹配的方法,这种方法可以提供建筑物准确的空间信息,使建筑物通过空间信息被检测出来[2]。不过这种方法需要额外的信 息,如DE M 信息。2)使用直线分析。首先从图片中检测出直线,将它们归类并且建模出矩形,推算出候选的建筑物[3]。直线可以通过使用感知的视觉数据组织的方法分类,许多报告已经使用这种方法进行了建筑物检测实验[4]。不过该方法对于大规模的检测效果不是很好。3)辅助信息的方法。如阴影或直线的透视效果,也可作为建筑物检测的重要手段。 作为一种低层次视觉技术,线段提取是一项很基本的任务。它的处理对象是边缘图像,输出是线段。其输出经常作为更高层处理(形状描述、目标识别、立体匹配等)的输入。由于线段提取的重要性,很多研究者在这方面做了大量工作。归纳起来,可分为3类:1)传统的H ough 变换;2)首先提取基本线段(e l ementary li ne segm ent ,ELS),再进行线段合并;3)利用梯度信息将边缘像素组成线段[3]。本文结合前两种方法,利用局部的H ough 变换,先抽取出直线,然后利用附有信息的直线分析图像中的对象,构建直线图的数据结构,并利用这些信息生成建筑物的候选集。 1 主要准则 通常将图像理解系统划分成几个阶段从而简化整个问题的难度。主要流程包括图像预处理,图像分割,特征提取,特征描述和识别。至今,对于各类应用还没有一个统一的方法。对于不同的项目的方法大相径庭。本文着眼于卫星图片中的建筑物检测。首先定义一些策略或思想准则作为解决这个问题的指导。 层次化 图像数据在计算机中以孤立点的信息形式存在。图像处理的目的是要对这些点尽可能地按照图像的原意进行分类,最后抽象出同类点集的含义。所有工作,包括前处理、图像分割、特征提取等,都是为了实现这一目标。在本文的研究中,首先将点归类成线,然后将线组合成几何形状。称之为点线面的变换。 整合方法 一些信息,比如颜色和方向,对图像中的元素来说是非常重要的,但不少方法忽略了这些信息的利用。在本文的研究中,将取得的颜色信息作为线和面对象的附属信息,或者称之为权重。这些信息可以帮助改善的检测过程。 局部化假设 假设物体,包括颜色、线的位置、面的位置以及图像中的所有元素,只和其一定范围内的邻域元素存在相应的关系。这个假说可以减少处理所花费的时间,从而得出各种可行的统计(现在的图像分析方法主要是基于数学统计的)。这个假设使得分治的方法能够得以实施,从而降低计算难度。 2 建筑物检测算法 整个检测算法主要分为以下4个阶段。 第28卷2008年6月 计算机应用 C o mpu ter App lications Vo.l 28June 2008

语义图像检索研究进展

语义图像检索研究进展 【摘要】本文探讨了基于语义图像检索相关技术,并且通过对语义图像检索技术的了解,我们讨论了语义图像检索存在的问题与其的发展方向。本文的研究具有重要的理论价值,同时为语义图像检索的发展起到启迪的作用。 【关键词】语义;图像检索;研究;进展 一、前言 在当今社会发展不断快捷的今天,人们有时候需要快速地检索出自己需要的图像,但是现在的图像信息是巨大的,这时候我们就需要某项技术能够帮助人们更快的找到我们需要的图像,基于语义的图像检索技术就是检索图像的方式之一,相信通过对其的研究能够达到更好的图像检索效果。 二、基于语义图像检索相关技术 1、图像语义模型 由于人们对图像内容的理解有着不同的层次,有人从图像的颜色去理解,有人从图像的对象去理解,也有人从图像所表现出来的行为去理解,也就是说图像的语义是具有不同层次的。王惠锋、孙正兴在他们的文章中给出了一个图像语义层次模型所示。他们把图像的语义定义为六个层次,从上到下依次为,特征语义,是指图像低层物理特征(颜色、形状、纹理)及其之间的相互组合,如蓝色的天空、红色的太阳;对象语义,是指图像当中出现的具有一定意义的对象,如一条狗、一座山;空间关系语义,是指图像各个对象之间的空间关系,如人旁边有条狗,狗旁边有只猫;场景语义,是指所有图像中对象所在的背景环境,如学校、森林;行为语义,是指图像内容所表现出的某种行为。 2、图像语义表示 如何描述图像的语义对语义的提取以及检索的效率有着十分重要的影响。语义的表示不仅要把图像的内容准确而客观的描述出来,对不同的内容有着不同的抽象,而且表示形式应当尽量简单、直观,同时考虑不同用户的不同需求。目前图像语义的表示方法大概有以下几种。 (1)文本形式。文本形式是最简单,也是最直观的图像语义表示方法。它是用关键字对整幅图像或图像的区域进行注解,另外还可以利用WordNet[26]将关键字之间的语义关系联系起来,而且它具有一定地同义词解析以及模糊匹配的能力。目前大多数的图像检索系统都是采用这种方法来表示图像语义的,比如IRIS 系统。但其不足之处也相当明显,它对具有复杂丰富内容的图像显得无能为力,而且自动获取这些关键字也存在着相当大的困难。 (2)知识表示方法。它是基于人工智能中的一些知识表示方法,如语义网

静态图像人体轮廓提取方法的研究

静态图像人体轮廓提取方法的研究 静态图像人体轮廓提取是指从静态图像中将人体轮廓分割出来,它在计算机视觉中的人体行为识别、背景分割与替换等多个方面都有着广泛的应用。静态图像人体轮廓提取面临着巨大的挑战,包括人体姿态的多样性,衣着的各异性,光线的变化以及复杂的背景等多个方面。 近年来,随着深度学习的快速发展,图像处理领域中基于传统特征提取的方法逐渐被深度学习所取代,而卷积神经网络在图像特征提取方面体现出了很大的优势。因此,采用卷积神经网络进行人体轮廓提取具有重要意义。 本文的主要研究内容如下:1.针对传统特征提取无法精准分割人体轮廓的问题,采用一种基于深度学习的人体轮廓提取方法。该方法设计了特定的卷积神经网络结构,在模型中引入了全卷积神经网络,反卷积与网络中网络的相关技术,实现了对静态图像在像素级别的人体轮廓提取。 2.为了提高模型的性能,在本文所构建卷积神经网络的基础上提出了一种改进方法,将原始图像经过Gabor滤波器进行预处理后再传入卷积神经网络,利用Gabor特征与卷积神经网络相结合实现了更精确的人体轮廓提取。 3.分别借助VOC2012数据集和百度人体分割数据集来验证本文所提出方法的有效性。 并将改进后的模型应用于具有隐私保护功能的视频监控系统,选择CAVIAR 视频监控数据集中的视频进行测试,并对结果进行分析。实验结果表明:(1)基于卷积神经网络的人体轮廓提取方法实现了对人体轮廓的快速有效分割,体现了利用深度学习进行实验的可行性;(2)改进后的模型在VOC2012数据集上的吻合度测试结果比原始模型提高了 10.96%;(3)在百度数据集上的测试结果表明该改进方法相比于其他现有方法,在准确度和处理速度等方面都能体现出合理性和有效

利用matlab进行图像检测--直线提取

H a r b i n I n s t i t u t e o f T e c h n o l o g y 图像工程导论 课程名称:图像工程导论 设计题目:《图像检测:直线提取》院系: 班级: 设计者: 学号: 哈尔滨工业大学教务处 图像工程导论任务书 二〇一五年柒月哈尔滨工业大学

一、课题详细描述: 提取图像中所有长度>8,<80像素的水平、垂直和对角直线。 二、课题设计思路: 读取图片后将其转化为灰度图后记为二值图像,对其进行边缘检测后通过霍夫变换检测直线,并将符合像素要求的水平、垂直和对角直线绘制在屏幕上。 三、代码清单及注释 x=imread('D:2.jpg');%读取图片 BW=rgb2gray(x);%转化为灰度图 imshow(BW); thresh=[0.01,0.17]; sigma=2; %定义高斯参数 f=edge(double(BW),'canny',thresh,sigma);%canny边缘检测 figure,imshow(f); [H,T,R]=hough(f,'ThetaResolution',89,'RhoResolution',10); %霍夫变换 P=houghpeaks(H,400,'Threshold',80,'NHoodSize',[1,1]); lines=houghlines(f,T,R,P,'FillGap',1,'Minlength',8); for k = 1:length(lines) xy = [lines(k).point1; lines(k).point2]; len = norm(lines(k).point1 - lines(k).point2); Len(k)=len if ( len > 8& len < 80) %限定像素范围 plot(xy(:,1),-xy(:,2),'LineWidth',2,'color','Red'); %绘制图像 hold on;

图像目标提取及特征计算

摘要 对图像进行研究和应用时,人们往往对图像中的某些部分感兴趣,这些部分常被称为目标或对象 目标或对象特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。 本课设需要解决的问题是,利用阈值分割方法,对该图像进行分割,得到提取那个目标后的二值图像,计算该目标的面积、周长、中心坐标等三个参数。阈值分割采用的是全局阈值分割方法,而面积、周长的计算则是先通过将图像转换成二值图像,在通过计算二值图像像素点的方式求取。 关键词:阈值分割,边缘检测,像素点

1绪论 目标的特征提取是图像处理和自动目标识别(ATR)中的一个重要的研究课题,是解决图像识别问题的难点和关键。 特征提取是图象处理中的一个初级运算,也就是说它是对一个图像进行的第一个运算处理。它检查每个像素来确定该像素是否代表一个特征。假如它是一个更大的算法的一部分,那么这个算法一般只检查图像的特征区域。作为特征提取的一个前提运算,输入图像一般通过高斯模糊核在尺度空间中被平滑。此后通过局部导数运算来计算图像的一个或多个特征。 有时,假如特征提取需要许多的计算时间,而可以使用的时间有限制,一个高层次算法可以用来控制特征提取阶层,这样仅图像的部分被用来寻找特征。 由于许多计算机图像算法使用特征提取作为其初级计算步骤,因此有大量特征提取算法被发展,其提取的特征各种各样,它们的计算复杂性和可重复性也非常不同。 2 设计原理 2.1 常用的特征提取的方法 提取图像空间关系特征可以有两种方法:一种方法是首先对图像进行自动分割,划分出图像中所包含的对象或颜色区域,然后根据这些区域提取图像特征,并建立索引;另一种方法则简单地将图像均匀地划分为若干规则子块,然后对每个图像子块提取特征,并建立索引。 本课程设计是采用的第一种方法,即先对该图像进行分割,得到提取那个目标后的二值图像,计算该目标的面积、周长、中心坐标等三个参数。阈值分割采用的是全局阈值分割方法,而面积、周长的计算则是先通过将图像转换成二值图像,在通过计算二值图像像素点的方式求取。其中计算周长时,先需要对二值图像进行边缘检测,然后再统计其像素点。 2.2 阈值分割原理 图像阈值化分割是一种最常用,同时也是最简单的图像分割方法,它特别适用于目标和背景占据不同灰度级范围的图像[1]。它不仅可以极大的压缩数据量,而且也大大简化了分析和处理步骤,因此在很多情况下,是进行图像分析、特征

(完整版)图像特征特点及常用的特征提取与匹配方法

图像特征特点及常用的特征提取与匹配方法 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 一颜色特征 (一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布的信息。 (二)常用的特征提取与匹配方法 (1) 颜色直方图 其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。 最常用的颜色空间:RGB颜色空间、HSV颜色空间。 颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。 (2) 颜色集 颜色直方图法是一种全局颜色特征提取与匹配方法,无法区分局部颜色信息。颜色集是对颜色直方图的一种近似首先将图像从RGB颜色空间转化成视觉均衡 的颜色空间(如HSV 空间),并将颜色空间量化成若干个柄。然后,用色彩自动分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一个二进制的颜色索引集。在图像匹配中,比较不同图像颜色集之间的距离和色彩区域的空间关系 (3) 颜色矩

相关主题