搜档网
当前位置:搜档网 › 基于内容的图像检索

基于内容的图像检索

基于内容的图像检索
基于内容的图像检索

基于内容的图像检索方法的研究

摘要

近年来,随着多媒体技术和计算机互联网技术的快速发展,数字图像的数量正以惊人的速度增长。面对日益丰富的图像信息海洋,人们需要有效地从中获取所期望得到多媒体信息。因此,在大规模的图像数据库中进行快速、准确的检索成为人们研究的热点。

为了实现快速而准确地检索图像,利用图像的视觉特征,如颜色、纹理、形状等来进行图像检索的技术,也就是基于内容的图像检索技术(CBIR)应运而生。其中,颜色特征作为图像的一种重要的视觉特征,已得到广泛的应用。本文主要研究基于图像颜色特征的检索。选用基于颜色直方图的算法,并利用Visual Basic程序设计语言和Access数据库技术设计实现了基于颜色直方图算法的图像检索系统。主要做法是:采用符合人类视觉特征的HSV颜色空间来表示图像的颜色特征,利用人对颜色的感知来对颜色分量进行非等间隔的量化并形成特征矢量,用相似性度量函数进行图像的相似性匹配,从而实现图像的检索。

关键字:图像数据库;CBIR;颜色直方图;相似距离

The Research of Content-based Image Retrieval Method

ABSTRACT

With the rapid development of multimedia and computer network technique, the quantity of digital image and video is going up fabulously. Facing the vast ocean of information of image, it has a good sense to obtain the desired multimedia information. Currently, rapid and effective searching for desired image from large-scale image databases becomes an hot research topic.

In order to retrieve image quickly and accurately using image visual features such as color, texture, shape, which named content-based image retrieval (CBIR) came into being. Among them, the color features as an important visual features of the image has been widely used. This paper studies the retrieval based on image color characteristics. Using algorithm based on color histogram, and the Visual Basic programming language and Access Database Design to implement the image retrieval system based on color histogram algorithm. The main approach is: to represent the image's color characteristics consistent with human visual characteristics of the HSV color space, using the perception of color to the color component unequal interval quantization and to form a feature vector, using measure function to match image similarity, in order to achieve image retrieval.

Key words: Image database; CBIR; Color histogram; Similarity distance

目录

1前言 (1)

1.1 课题背景及研究意义 (1)

1.2 基于内容的图像检索技术研究的现状和发展方向 (1)

1.3 本文主要研究内容 (2)

2 基于内容的图像检索 (3)

2.1 概念 (3)

2.2 特点 (3)

2.3 CBIR过程的一般框架 (3)

3 图像特征提取与相似性度量 (5)

3.1 图像的文件格式 (5)

3.2 颜色模型 (6)

3.2.1 RGB颜色空间 (6)

3.2.2 HSV颜色空间 (7)

3.2.3 RGB 颜色空间到 HSV 颜色空间的转换 (7)

3.3 颜色量化 (8)

3.4 颜色直方图 (8)

3.5 基于子块颜色直方图算法 (9)

3.6 图像的相似性度量 (10)

3.6.1 图像的相似度 (10)

3.6.2 相似度计算公式 (10)

4 基于颜色特征的图像检索系统设计和实现 (12)

4.1 系统结构设计 (12)

4.2 图像特征数据库设计 (12)

4.3 系统开发环境 (12)

4.4 系统流程 (13)

4.5 系统的实现 (13)

4.5.1 图像的获取 (13)

4.5.2 图像特征的提取 (14)

4.5.3 图像的检索 (16)

5 总结 (18)

参考文献 (19)

致谢 (20)

1前言

1.1 课题背景及研究意义

近年来,伴随着计算机网络技术和多媒体数据库技术的迅猛发展,特别是大量图像数据的广泛应用,实现图像检索成为多媒体数据库中最基本也是最普遍的要求。传统的图像检索是基于文本方式,对图像库中的每一幅图像使用关键字进行标记,然后利用文字属性的匹配进行对图像的检索。这种基于文本的图像检索需要人工注解的工作量很大,且文本描述很难准确的表达图像中丰富的信息,常常会因为不同人对同一内容的描述方式不同而千差万别,造成检索的准确程度降低。在信息需求的不断增加和日益迫切的今天,原始的图像检索系统已经远远不能满足要求。因此,基于内容的图像检索技术的研究越来越成为人们研究的热点。特别是多媒体内容描述接口MPEG-7①的制定和完善,更加推动了这一技术的开发和运用。

基于内容的图像检索技术对促进图像技术的发展具有重要的作用。首先,在检索图像的准确度上,基于内容的图像检索技术把图像的颜色、形状、纹理等视觉特征作为图像的内容来查找和匹配图像,通过算法实现图像特征的提取和图像间的相似性匹配,提高了检索结果的准确性。其次,随着数据库技术研究的深入、计算机视觉以及人工智能的发展,我们可以对图像的这些特征进行自动的提取和匹配,大大减少了人工的工作量,从而在提高检索准确度的同时,降低了图像检索所需要的时间。目前,这项技术已经广泛应用于图像的网络搜索、遥感、数字图书馆、计算机辅助设计、地理信息系统、商标版权管理等诸多领域,具有广阔的应用前景。

1.2 基于内容的图像检索技术研究的现状和发展方向

目前,对图像的检索在图像索引与研究中应用最为广泛,基于图像颜色特征、纹理特征、形状特征和物体空间方位的检索方法是比较成熟的几种。

近年来,基于内容的图像检索引起了多交叉学科研究人员的注意。在国外,特别是在美国等发达国家,这项技术已成为一个研究热点。一些科研部门、高等院校、商业公司甚至于政府机构都纷纷投入大量人力和物力进行系统的研究和开发,以期取得领先地位。目前已经推出了一些CBIR系统的产品,如美国的IBM公司、Virage和Excalibur都已经开发出了的基于图像内容的相似性特征的图像库检索引擎,并在网上提供了演示站点。

国内的研究主要集中在基于图像颜色的查询,也有一部分基于纹理和形状的查询。自20世纪90年代以来,基于内容的图像检索成为一个研究热点。目前,该技术已成功应用于人脸识别技术;针对商标与设计专利类的图像进行检索,防止专利纠纷的产生。除此之外,它还可以解译影像数据中的建筑、村庄、耕地等不同种类的地形信息,实现对遥感图像的检索。

①MPEG的全名为Moving Pictures Experts Group,中文译名是动态图像专家组。

基于内容的图像检索技术研究的发展方向主要有:

(1)两类图像检索技术的结合

传统的图像搜索引擎主要侧重于对图像内容的文本描述,而图像库检索技术则更侧重于通过算法对图像内容的特征的提取和匹配,它们虽然侧重不同却相互补充。如果能将二者结合起来,取长补短,则图像检索技术必将会有新的进展。

(2)对基于内容的编码技术的研究

自20世纪90年代起,国际上就有了对基于内容的图像检索技术的研究。从基本的颜色检索,到综合利用多种图像特征进行检索,推出了大量原型系统。其中,部分已经投入到实际应用中并取得良好效果。在Internet环境下,MPEG专家组制定了一个基于内容的多媒体描述方案,即MPEG-7标准,对各种不同类型的多媒体信息内容的描述方式进行了标准化定义,从而实现CBIR与TBIR(基于图像文本特征的检索)的互连。

总之,该项技术在实际中的应用会越来越广泛,而且必将在各个领域当中占据主导地位,并带动相关产业的发展,促进多媒体信息化的交流。

1.3 本文主要研究内容

本文在介绍基于颜色特征的图像检索技术的基础上,将颜色直方图作为研究重点,对CBIR技术进行了较为全面的研究,以多媒体图像数据库为平台,将CBIR作为一种信息检索技术,应用到图像数据库中,作为检索引擎来实现基于颜色特征的图像检索功能。

(1)详细讨论了常见的颜色特征表示方法以及从RGB模型到HSV模型的转换和颜色特征的提取方法,采用符合人类视觉感知特征的HSV模型来提取颜色特征,并按照人的视觉分辨能力将颜色量化为36柄的一维特征向量。

(2)运用相似性度量算法,用户可以根据自己的兴趣,针对不同的区域,灵活地调整权重系数,更准确地实现图像颜色特征的匹配。

(3)在开发工具上,选用Visual Basic 6.0程序设计语言,对图像进行了定义,完成图像特征的读入和提取,用Access数据库存放图像的特征索引向量,并通过颜色匹配算法实现基于图像颜色特征的检索功能。

2基于内容的图像检索

2.1 概念

基于内容的图像检索(CBIR)是指根据图像颜色、纹理、形状等视觉特征,从已定的图像库中查找含有特定特征的图像。与传统的图像检索手段不同,它融合了图像理解技术,在输入图像的同时将其相应的特征向量也存入特征库。在进行图像检索时,对每一幅给定的关键图,进行图像分析,并提取图像的特征向量。将该图像的特征向量和特征库中的特征向量进行匹配,根据相似距离的大小在图像库中进行搜索就可以得到所需要的检索图了。

2.2 特点

CBIR 方法利用图像的视觉特性,实现了用图像来检索图像。这比利用传统的文字标注等要有效的多。基于内容的图像检索是根据图像的颜色、形状、纹理等特征以及这些特征的组合来查询图像的,这是计算机图像处理和数据库技术的很好的结合。它具有以下几个显著的特点[1]:

(1)用于检索的是反映图像内容的各种量化特征;

(2)使用基于相似性度量的近似查询;

(3)大多采用实例查询QBE(Query By Example)方法。

对于基于内容的图像检索有三个关键:一是要选取恰当的图像特征;二是要采取有效的特征提取算法;三是要有准确的特征匹配算法。

2.3 CBIR过程的一般框架

CBIR系统可以看作是一个用户和图像数据库之间的一个界面或通道[2],其过程的一般框架可以描述为如图2-1。

图2-1 基于内容的图像检索

各模块的作用:

(1)查询模块:为用户提供多样的查询手段,以支持用户进行多种类型的查询;

(2)描述模块:将用户查询的外部表达转化成为对图像信息内容的内部表达和描述;

(3)匹配模块:将查询描述与库中被查询信息的描述进行匹配,确定它们内容的一致性和相似性;

(4)提取模块:把满足既定条件的信息自动的从库中提取出来;

(5)验证模块:为用户提供方便的验证手段以评价提取的效果。

目前,很多基于内容的图像检索系统中还包含有用户反馈机制,其主要功能是收集检索出的图像信息,根据用户自己的期望,对搜索到的图像进行粗略的判断,然后修改查询信息并提交给查询模块。

3 图像特征提取与相似性度量

基于内容的图像检索系统在进行图像检索的过程中,将关键图和被检索的图像进行图像分析,提取出这些图像的特征向量,再将关键图的特征向量和被检索的图像的特征向量进行相似性匹配,根据相似距离检索到期望的图像。由这个工作原理可知,该系统的关键点包括:选取恰当的图像格式,以便提取其有效的颜色特征;选择准确的特征匹配算法,从而实现图像的相似性匹配。因此,如何恰当的提取颜色特征,以及对颜色特征如何进行有效地抽取和匹配也就成为CBIR研究领域的重点。

3.1 图像的文件格式

本文采用的图像格式是BMP格式。BMP文件是常见的图像文件格式之一,是 Windows 操作系统中的标准文件格式。由于不进行图像压缩,所以BMP图像文件能够表达丰富的色彩信息。BMP图像文件的结构可以分为四个部分:文件头数据结构、文件信息数据结构、调色板以及图像数据。

其中,文件头的长度为固定值54个字节;调色板数据对所有的不超过256色的图像模式都需要进行设置,即使是单色图像模式也不例外;图像数据既可以采用一定的压缩算法进行处理,也可以不必对图像处理软件进行压缩处理,这不仅与图像文件的大小有关,而且也与对应的图像处理软件是否支持经过压缩处理的BMP图像文件相关[3]。

图像文件的文件头和文件信息头的定义形式如下:

(1)文件头(BITMAPFILEHEADER)

Public Type bitmapfileheader

bftype As Integer

bfsize As Long

bfreserved1 As Integer

bfreserved2 As Integer

bfofbits As Long

End Type

该程序中定义了BMP文件的类型、大小,以及图像数据的偏移量,即从文件头开始多少个字节后是图像数据的起始。

(2)文件信息头(BITMAPINFOHEADER)

Public Type bitmapinfoheader

bisize As Long

biwidth As Long

biheight As Long

biplanes As Integer

bibitcount As Integer

bicompress As Long

bisizeimage As Long

bixpelspermeter As Long

biypelspermeter As Long

bicirused As Long

BMP文件信息头基本上包含图像的所有重要的信息,包括宽度、高度和每像素的位数。

3.2 颜色模型

所谓颜色模型[2]是指某个三维颜色空间中的一个可见光子集,包括某个颜色域的所有颜色。常见的颜色模型包括RGB(红、绿、蓝),HSV(色调、饱和度、亮度),CMYK(青、洋红、黄、黑)等。其中,HSV空间是一种符合人类视觉感知特征的颜色空间,特别适合于人类肉眼对颜色的识别,因此被广泛应用于计算机视觉领域。

3.2.1 RGB颜色空间

RGB 颜色空间是一种常用的颜色空间。目前,图像采集系统以及彩色显示器等硬件显示设备大都采用了 RGB 颜色空间来表示颜色。数字图像一般也都采用这一颜色空间来表示。

如图 3-1所示,RGB颜色模型是三维直角坐标颜色系统的一个单位正方体。它以红(R)、绿(G)、蓝(B)作为三基色。在空间坐标系的原点上,三基色的亮度均为零,此时代表黑色;当三基色同时达到最高亮度时为白色;由等量的三基色组合而成的颜色是灰色,这些灰色点均落在RGB彩色立方体的对角线上。

图3-1 RGB颜色空间

虽然RGB空间模型在实际生活中广泛应用,但是它并不具有视觉一致性,不符合人对颜色的感知心理,且RGB颜色空间上的距离并不代表人眼视觉上的差异。因此,需要用另一种符合人的视觉感知的颜色模型来表示颜色。

3.2.2 HSV 颜色空间

HSV 颜色空间具有视觉一致性,它比RGB 颜色空间更符合人的视觉特性。HSV 颜色空间把常见颜色表示为三种属性:色调 H(Hue)、饱和度S(Saturation)和亮度 V(Value)。HSV 模型对应于圆柱体坐标系的一个圆锥子集。圆锥的顶面对应于V=1,色调H 又绕V 轴给定,饱和度S 取值从0到1,由圆心向圆周过度。H 表示色调信息,即所处的光谱颜色的位置,通常由颜色名称来辨别,如红、橙、黄、绿等,它用角度-180~180或0~360来度量。饱和度S 为一比例值,指颜色的深浅程度,范围从0%到浓度完全饱和的100%,它表示所选颜色的纯度和该颜色最大的纯度之间的比率,即在纯色中包含白色光的成分。V 表示色彩的明亮程度, 0%为最暗的黑色,而

[3]3-2所示。

HSV 颜色空间直接对应于人眼色彩视觉特征的三要素,通道之间各自独立,因此可以独立感知各颜色分量的变化,其中色调尤其影响着人的视觉判断。因此在基于内容的图像检索中,应用这种颜色空间模型会更适合用户的视觉判断。

3.2.3 RGB 颜色空间到 HSV 颜色空间的转换

一般情况下,人们认识到的图像都是在RGB 颜色空间描述的,但在图像检索的应用过程中,HSV 空间模型更适合于人的视觉感知。因此,应该将图像从RGB 空间模型转换到HSV 空间模型[4]。设r ,g ,b [0,1,2,……,255],由RGB 颜色空间模型到HSV 颜色空间模型的转化为:设v ’=max(r ,g ,b),定义r ’,g ’,b ’为:

r ’=v ′?r

v ′?min ?(r,g,b),g ’=v ′?g ′

v ′?min ?(r,g,b), b ’=v ′?b

v ′?min ?(r,g,b),则 v=v ’/255,v [0,1]

S =

v ′?min r,g,b

v ,max ?(r,g,b)≠min ?(r,g,b) 0 , max r,g,b =min ?(r,g,b)

,S ∈[0,1]

(3-1)

5+b’,若r=max(r,g,b)且g=min(r,g,b)。1?g’,若r=max(r,g,b)且g≠min(r,g,b)

60h= 1+r’,若g=max(r,g,b)且b=min(r,g,b) ,S=0,S∈[0,0.25]

1,S∈[0.25,1](3-2)

3?b’,若g=max(r,g,b)且b≠min(r,g,b)

3+g’,若b=max(r,g,b)且r=min(r,g,b)

5?r’,否则

这里r,g,b[0,255],h[0,360][4]。

3.3 颜色量化

颜色量化是指确定一组颜色以表示图像的颜色空间,然后确定从颜色空间到选定颜色集合的映射,即将颜色空间映射到一个给定大小的子集中,并使其总体误差最小。因为CBIR 中采用的HSV颜色空间具有视觉一致性的特点,而且人眼分辨颜色的能力是有限的[5]。因此,在量化时可以考虑按照人的颜色感知对颜色空间进行非等间距的量化,量化结果为:0,H∈[0,60]

1,H∈[60,120] 0, V∈[0,0.3]

H= 2,H∈[120,180] ,S=0,S∈[0,0.25]

1,S∈[0.25,1], V= 1, V∈[0.3,0.8] (3-3)

3,H∈[180,240] 2, V∈[0.8,1] 4,H∈[240,300]

5,H∈[300,360]

量化结束后,可以将HSV颜色空间划分为L

H L

S

L

V

个相似色空间,其中量化级数L

H

=6,

L S =2,L

V

=3。故把三个分量合并成一个一维的特征矢量就是L=L

S

×L

V

×H+L

V

×S+V=6H+3S+V。这

样H、S、V三个分量分布在一维矢量上,L的取值范围为[0,35],即颜色量化后的图像可以得到36柄的一维颜色直方图[3]。

3.4 颜色直方图

对于基于颜色的图像检索系统,关键问题之一是对颜色特征的提取。目前,大部分基于颜色的检索系统都是以比例分布作为颜色的基本特征,这也就是图像的颜色直方图。

颜色的直方图特征是图像检索领域中提出最早、算法最简单,而且具有尺度不变性和旋转不变性[2],因此成为使用最为广泛的颜色特征之一。它是在确定颜色空间的基础上,统计出图像中每种颜色分量的像素数占图像总像素数的比值,从而得到图像各种颜色分量的比例分布直方图,将其转换成为一维的特征向量,作为这幅图像的特征。颜色直方图是颜色信息的函数,它表示图像中具有同颜色级别的像素的个数,其横坐标是颜色级别,纵

坐标是颜色出现的频率,即像素的个数。

颜色直方图是一种概率统计的方法。它将图像中各颜色像素的个数进行统计,并用直方图的形式表达出来,具体定义为:

H(P)=(h

c1(L),h

c2

(L),h

c3

(L),……,h

ci

(L)……)

其中,h

ci (L)=||Lci||

N

,||L

ci

||表示图像中所有颜色为C

i

的像素的个数。

这种颜色直方图只反映了图像中所占的百分比,而丢失了图像颜色的空间分布信息,也就是说两幅颜色空间分布完全不同的图像(如天空和海洋)仍可以具有相同的直方图,这势必造成检索的误差。这时,可以加进颜色的空间分部信息。

3.5 基于子块颜色直方图算法

一般颜色直方图在算法上比较简单,但图像检索时却不够准确,因为颜色直方图相似的图像可能内容差别很大。这时便可以通过利用基于子块颜色直方图算法来实现图像的检索。将图像划分为几个单元,然后分别计算这些单元颜色直方图。在计算图像的相似距离时,先计算每张图像中每个单元之间的距离,然后将这些距离组合起来,便可以得到图像与图像的距离。

基于子块颜色直方图的图像检索方法可以采用一种比较简单的固定划分策略,将图像分解成为若干个大小相同并且互相不重叠的单元区域。同时,用户可以对自己感兴趣的子块增大权重,提高检索准确率。

通常情况下,主要内容位于图像的中间区域,图像的四周大多是背景画面。因此可以采用这样一种分块方法[3]:

图3-3 分块策略

由此划分方法可知:图像的主要区域位于第5块,其余的标号为1、2、3、4的属于背景。在特征的提取过程中,提取第5块的主颜色,提取1、2、3、4块的平均颜色,剩下图像的四角部分对图像特征影响不大,往往可以忽略。提取特征的方法为:(1)计算各个分块的一般颜色直方图

设二维数组L[I,j]中存放的是图像各像素点量化后的HSV颜色值,其中i,j为各像素

点坐标。数组PicCenter[k]中存放中心区域的一般直方图,k 为量化后的HSV 颜色值。

(2)然后计算第5块(中心区域)的主颜色m5

主颜色是指图像中出现次数最多的那种颜色,即main=取下标(max{h[c]})。将设定好的颜色区域窗口沿直方图从左向右移动,并记录窗口内颜色的总频数。得到总频数最大的窗口位置时,此窗口内颜色的加权平均值即为图像的主颜色,即main= ci ×h[ci]/ h[ci]。

(3)计算1、2、3、4块的平均颜色ei ,i=1,2,3,4

平均颜色是一般直方图颜色的加权平均:mean= c 35c=0×h[c]/ h[c]35c=0。

(4)图像分块颜色特征向量

由第5块的主颜色和1、2、3、4块的平均颜色共同组成了分块颜色特征向量:F={m5,e1,e2,e3,e4}。

3.6 图像的相似性度量

在基于内容的图像检索中,特征的相似距离的度量也是需要解决的重要问题之一。只有在得到了图像的特征后进行特征的相似性度量,才能有效的根据相似距离进行比较,准确地实现图像检索。

3.6.1 图像的相似度

为了达到图像检索的目的,需要对提取的特征进行相似度计算。相似度是以数值的形式来表示两幅图像之间的相似程度的度量结果,即相似距离。将图像的特征看作是坐标空间中的点,两个点的接近程度即相似度通常用他们之间的距离表示,不同类型的特征数据所采用的相似性度量函数是不一样的,相似度公式的选择的恰当与否对检索的精确度有很大的影响。合适的距离算法的选择,有助于基于内容的图像检索的性能提高。

3.6.2 相似度计算公式

图像颜色特征相似关系的研究通常使用的是几何模型。对于几何相似距离的数学表达形式可以采用以下几种表示方法[2]:

(1)欧式距离公式

欧式距离是一个常见的判断两个对象相似的公式,图像X 和图像Y 之间的距离定义为: Sim (X ,Y )=||X-Y||= xi ?yi (xi ?yi )n i=1 (3-4) 当Sim (X ,Y )越大时,两幅图像在这一特征上的差异就越大,反之两幅图像就越相似。但是由于欧式距离在计算中没有考虑颜色间的相似性,不符合人的视觉感受,可以采用直方图二次型距离法克服这一缺陷。

(2)直方图的二次型距离

这种计算距离的公式中加进了颜色相似矩阵,其形式为D (H m ,H k ) = (H m -H k ) T A (H m -H k ),矩阵A n ×n =[a ij ],权a ij 表示H m 中第i 个元素H m [c i ],与H k [c j ]的相似程度,a ij =a ji 且a ii =1,其中H m 为目标图像颜色直方图,H k 为库中颜色直方图。

(3)分块颜色特征向量计算法

对于分块颜色特征,可以采用下式计算相似距离:

D(Q,T)=w5mQ?mT mQ?mT+wi(eQ?eT)(eQ?eT)

i=1,2,3,4(3-5)

wi=

0.4, 当i=5时 0.15, 当i=1,2,3,4时

其中w

i 为加权系数,以上w

i

值为系统所设定的初值,用户可以根据图像实际情况设置

不同的加权系数。

4 基于颜色特征的图像检索系统设计和实现

4.1 系统结构设计

在系统的实现上,将系统结构划分为图像入库子系统和图像检索子系统。

图像入库部分的主要功能是图像获取、图像特征的提取和读入。在图像获取过程中,采用BMP图像组成图像数据库,用户可随意选择需要的图像。提取特征时,将BMP图像的RGB颜色空间转换为HSV空间并提取图像的颜色特征作为索引,写入图像特征数据库中。

图像检索部分是完成基于图像颜色的检索。运用颜色特征匹配算法,通过相似性距离函数将待检索图像的特征和特征库中的对应特征进行匹配,实现图像的检索,并最终把检索结果显示出来。

4.2 图像特征数据库设计

在CBIR系统的设计过程中,还需要考虑图像数据库中图像存放的形式及图像数据库的格式。图像特征数据库用于存放图像库中各图像的颜色特征。在这里,将得到的一维直方图特征作为图像的特征向量存放到Access相应的特征表中,组成特征数据库。

可将Access数据表的模式设计为(No,t0,t1,t2,……,t35,文件名称,相似距离),其中t0~t35字段用来存放每张图像的一维直方图特征向量。文件名称字段存放检索出来的图像的名称。相似距离字段存放的是待检索图和图像库中图像之间的相似距离,用数字表示出来。

4.3 系统开发环境

Visual Basic 6.0是微软公司推出功能强大的面向对象的可视化的程序设计语言。它具有强大的图像处理功能,如Image控件,Picture Box控件等。同时,VB6.0还使用两种数据访问技术:JET数据库引擎和ODBC技术,这是数据访问的核心部分。而且数据库引擎能够把数据控件和数据访问对象所提出的数据库操作转变成对数据库的物理操作。

4.4 系统流程

根据对实验系统中的图像数据库结构及其算法、颜色模型、距离度量函数等方面的设计,开发了图像检索系统。检索系统流程图如图4-2。

图4-2 检索系统流程图

4.5 系统的实现 4.

5.1 图像的获取

图像入库的界面如图4-3所示,用户可以自由添加图像,并将该图像的颜色特征读入图像特征数据库中,形成自定义的特征库。除此之外,用户还可以自主选择待检索的关键图。

图4-3 图像入库界面

4.5.2 图像特征的提取

特征提取是把图像的颜色特征信息提取出来存入图像特征数据库,以此特征来进行对待检索图像的检索。在这个过程中,先将图像的RGB 模型转换成HSV 模型,量化后得到36

柄的一维直方图,其算法如下:

For i = 0 To 35

t(i) = 0

Next i

For j = 0 To YPos - 1

For i = 0 To XPos - 1

r = PicCol(i, j, 2): g = PicCol(i, j, L): b = PicCol(i, j, 0) v1 = Max(r, g, b): v = v1 / 255

If v1 = Min(r, g, b) Then

r1 = 0: g1 = 0: v1 = 0: s = 0

Else

r1 = (v1 - r) / (v1 - Min(r, g, b))

g1 = (v1 - g) / (v1 - Min(r, g, b))

b1 = (v1 - b) / (v1 - Min(r, g, b))

s = (v1 - Min(r, g, b)) / v1

End If

If r = g And g = b Then

h1 = 5 - r1

Else

If r = Max(r, g, b) And g = Min(r, g, b) Then

h1 = 5 + b1

ElseIf r = Max(r, g, b) And g <> Min(r, g, b) Then

h1 = 1 - g1

ElseIf g = Max(r, g, b) And b = Min(r, g, b) Then

h1 = 1 + r1

ElseIf g = Max(r, g, b) And b <> Min(r, g, b) Then

h1 = 3 - b1

ElseIf b = Max(r, g, b) And r = Min(r, g, b) Then

h1 = 3 + g1

Else

h1 = 5 - r1

End If

End If

h = h1 * 60

Select Case h '量化HSV模型

Case 0 To 60

hh = 0

Case 60 To 120

hh = 1

Case 120 To 180

hh = 2

Case 180 To 240

hh = 3

Case 240 To 300

hh = 4

Case 300 To 360

hh = 5

End Select

Select Case s

Case 0 To 0.25

ss = 0

Case 0.25 To 1

ss = 1

End Select

Select Case v

Case 0 To 0.3

vv = 0

Case 0.3 To 0.8

vv = 1

Case 0.8 To 1

vv = 2

End Select

L_PicCol(i, j) = 6 * hh + 3 * ss + vv

t(L_PicCol(i, j)) = t(L_PicCol(i, L)) + 1

Next i

Next j

这里给出一幅示例图像,如图4-4中的“国旗”图像,利用上述算法得到的该图像的36柄一维直方图,并将其作为特征向量读入图像特征数据库,如表4-1所示。

图4-4 示例图像

表4-1 示例图像的特征向量

4.5.3 图像的检索

在用户自主选择好图像特征信息库,将图像的颜色特征都读入其中后,便可以选择一张待检索的图像,根据待检索图像和图像特征信息库中的图像之间的相似距离来检索出与待检索图像颜色特征最为相近的图像来,并按照相似距离的大小排列显示。图像检索的算法为:

Public Sub Search()

Dim sumRecord As Integer

Dim distance As Long

Dim similar(6) As String

Set mycon = New connection

mycon.Open "provider=Microsoft.Jet.oledb.4.0;data source=" & App.Path & "\图像特征数据库\图像特征.mdb;persist security info = false"

Set rtezh = New Recordset

rtezh.Open "select * from tezheng", mycon, adOpenKeyset, adLockPessimistic

sumRecord = rtezh.RecordCount

Do Until rtezh.EOF = True

distance = 0

For a = 0 To 35

distance = distance + (rtezh.Fields(a + 1) - t(a)) * (rtezh.Fields(a + 1) - t(a))

基于颜色直方图的图像检索(实验分析)

基于颜色直方图的图像检索 作者:吴亚平学号:200812017081203009 1.概述 在过去的十几年间,有许多知名机构都对图像检索系统进行了深入的研究,病开发出了相应的检索系统,例如IBM Almaden研究中心研制的QBIC系统,Virage公司研发的VIRAGE系统,麻省理工大学多媒体实验室研发的Photobook系统,哥伦比亚大学研发的VisualSeek系统,斯坦福大学研发的WBIIS系统,U.C.伯克利分校研发的Blobworld系统等等。 这些检索系统的基本特征都是基于图像像素值的特征提取相应的规则图像,例如形状、颜色、纹理等,并以此为依据对图像进行比较检索,在这篇论文中,系统采用了基于颜色特征提取的检索。基于直方图在两个颜色空间对图像特征进行判定检索。这两个颜色空间是RGB和HSV。通过对两副图像对应的RGB和HSV 值计算其距离,依据距离的远近来判断相似性,这种方法简单易行,由于丢弃了图像的形状、颜色、纹理等信息,判定的计算量相对较小。当然这也导致了两副图像之间的判定没有实际的语义上的关联,也就是说,距离相近的图像并不一定有事实上的相应联系。但是,经过试验的判定,这种基于直方图的图像检索系统能够为图片检索提供相对精确的检索结果。 2.相关知识 2.1. RGB颜色空间 RGB颜色模型中每种颜色都是由红绿蓝三种颜色组成。这种颜色模型在许多CRT显示器和彩色光栅图形设备中被广泛使用。这三种颜色被认为是其他颜色的

添加剂,对于所需要的颜色通过对这三种颜色进行不同的比例进行相加即可得到。RGB模型可以用如下的颜色坐标系表示。注意从(0,0,0)到(1,1,1)的对角线,白色代表了灰阶,RGB色彩模式俯视从白色开始的。 2.2. HSV颜色空间(也称HIS颜色空间) HSV字母分别代表了色度(Hue),饱和度(Saturation),色调。上面的锥形图说明HSV的颜色模型。Value代表了颜色的强度,他是从图像信息中分离出来,可以表示相关信息的部分。色度和饱和度代表了颜色在人眼中的生理特征。色度与红色等颜色从0到1的表示不同,色度是从红色通过黄,绿,青,蓝,洋红色,再回到红色。饱和度的区分是从0 到 1,他通过值大小来影响颜色的饱和度。对于色调,也是从0到1,随着他的增大,图像的颜色就会越来越亮。

4-基于内容的图像检索

研究生课程 数字图像处理Digital Image Processing 彭宇新 北京大学计算机科学技术研究所E_mail:pengyuxin@https://www.sodocs.net/doc/fd1664487.html,

基于内容的图像检索 ●为什么需要基于内容的图像检索? ●查询方式,查询demo,现有系统简介●具体内容 ?特征提取 ?相似度匹配 ?相关反馈 ?索引结构 ●MPEG-7介绍:性能评价等 ●思考的几个问题?

为什么需要基于内容的图像检索? ●当前图像内容的特征 ?海量的图像内容出现 人类已有的:历史、地理、军事、医学… 每天新增的:数码相机、互联网?图像内容的特征:没有索引、目录或摘要 ?怎样找到需要的图像?

●基于文字描述的图像检索 ?丰富的图像内容很难用文字来全面描述 ?文字的选取因人而异,带有很大的主观性 ?耗费大量的人力和时间 ●结论:对于海量的图像,基于人工标注文字的检索已不可能 ●问题:目前搜索引擎提供的基于文字的图像检索,能够解决问题吗?解决得好吗?为什么需要基于内容的图像检索?

●为什么需要基于内容的图像检索(CBIR)? ?提供图像的检索功能 ?不需要人手工标注,计算机自动分析和检索,节省人力和时间 ?使海量图像的管理和索引成为可能 ?存在的问题: 人类高级语义特征与计算机底层特征表示的矛盾 查询方式问题 为什么需要基于内容的图像检索?

基于内容的图像检索 ●为什么需要基于内容的图像检索? ●查询方式,查询demo,现有系统简介●具体内容 ?特征提取 ?相似度匹配 ?相关反馈 ?索引结构 ●MPEG-7介绍:性能评价等 ●思考的几个问题?

基于内容的图像检索方法研究现状

基于内容的图像检索方法研究现状 【摘要】本文对基于内容的图像检索方法做了较详细的总结,其中主要讨论了空间域图像检索算法,基于颜色、形状、纹理、频率域的图像检索算法,进行研究比较。 【关键词】图像检索方法;颜色图像检索算法、形状图像检索算法、纹理图像检索算法、频率域的图像检索算法 一、引言 为了解决基于文本关键字的图像检索存在的问题,基于内容的图像检索方法成为图像检索的研究热点。基于内容的图像检索方法就是在将图像存入图像库的同时,自动提取反映该图像内容的特征向量,并存入与图像库相连的特征库。在进行图像检索时,对每一幅给定的查询图像自动提取该图像的特征向量,通过将该图像特征向量与特征库中的特征向量进行匹配,并根据匹配结果到图像库中搜索,就可提取出与所查询图像最相似的图像。 二、空间域图像检索算法 随着基于内容图像检索算法为人们所逐渐重视,空间(像素)域图像检索算法被广泛研究。所谓空间域图像检索是指直接在数字图像矩阵上提取图像特征,对图像进行相似性匹配,提取特征为颜色,形状和纹理信息。 2.1基于颜色的图像检索方法 颜色具有一定的稳定性,是图像最直观而明显的特征,因此成为检索中最常用的视觉特征。基于颜色的图像特征一般采用直方图来描述,其算法基本上都是以颜色直方图相交算法为基础而设计。用色彩特征进行图像检索可以追溯到Swain和Ballard提出的色彩直方图的方法。主要可以分为两类:全局色彩特征索引和局部色彩特征索引。 1、全局色彩特征索引 全局色彩特征索引方法目前采用最多的是色彩直方图的方法。Pass等人提出以图像的色彩聚合矢量CCV来作为图像的索引,它是图像直方图的一种演变。Stricker和Orengo提出了累计色彩直方图方法,并提出了色彩矩的方法,认为色彩信息集中在图像色彩的低阶矩中。他们对每种色彩分量的一阶、二阶和三阶矩进行统计。Rickman和Stonham提出了色彩元组直方图的方法,将一幅图像中的所有色彩用一些色彩元组来表示,这些色彩元组特征形成了一个特征编码簿,然后对一幅图像中特定位置的n个采样点所对应的色彩元组的特征值在特征编码簿中出现概率进行统计,就形成了一个色彩元组的直方图。

基于内容的图像检索系统报告

第六届浙江省大学生电子商务竞赛 作品名称:基于内容的网络商品图像检 索系统 作品类别:技术类 2011年3月13日

目录 第1章项目背景 (3) 第2章关键技术介绍 (6) 第3章系统分析与设计 (8) 3.1需求分析 (8) 3.1.1功能性需求分析 (8) 3.1.2非功能性需求分析 (8) 3.2系统设计 (10) 3.2.1 总体结构设计 (10) 3.2.2 功能模块设计 (11) 3.2.3 检索流程设计 (12) 3.2.4数据存储设计 (14) 3.2.5 算法设计 (17) 第4章系统实现 (25) 4.1 数据采集模块 (25) 4.2 数据检索模块 (28) 4.3 数据显示模块 (29) 4.4 数据推送模块 (34) 第5章盈利模式与市场营销推广策略 (36) 5.1目标市场 (36) 5.2盈利模式 (36) 5.3 系统推广策略 (37) 第6章财务分析 (41) 6.1搜索系统建设成本 (41) 6.2搜索引擎运行维护成本 (41) 6.3搜索系统宣传推广成本 (42) 第7章风险及对策 (43)

7.1市场风险及对策 (43) 7.2技术风险及对策 (43) 7.3项目风险及对策 (44) 7.4竞争风险及对策 (44) 第8章创新点 (45) 第9章总结 (46) 【参考文献】 (47)

第1章项目背景 随着计算机软硬件和互联网技术的飞速发展,多媒体数据的数量以惊人的速度增长。各行各业有越来越多的信息通过图像的形式进行表达,这些图像中包含了大量有用的信息。但是这些图像松散的分布在世界各地,缺少有效的组织,难以达到资源共享的目的。因此如何利用如此众多的图像信息并从中定位感兴趣的图像,是对图像信息的查询技术提出的重大挑战。 早在1951年,信息检索(Information Retrieval)这一术语就被Calvin M oores描述为使用户的信息需求能够变为最终的有用信息的过程。当然,他当时指的是文本格式的文件检索。但他的描述却揭示了信息检索系统的实质:帮助用户具体定位相关信息。 在1970年以后,随着数据库管理和计算机视觉两个领域的飞速发展,图像检索技术(Image Retrieval)的研究成为热点。由于图像检索在这两个领域的不同应用,所以它们采用的研究方法也各自有所侧重。数据库管理领域的研究采用基于文本的图像检索方法,而计算机视觉领域则偏重于基于视觉的图像检索。 基于文本的图像检索(text-based image retrieval),主要在数据库领域中进行研究,它的一个典型框架是,首先对图像用文本进行注解(关键字),然后用基于文本的数据库管理系统(DBMS)来进行图像关键字检索,诸如数据模型、多维度索引、查询评价等的研究进展均是沿着这一领域所作的。但是,基于文本的图像检索存在很大困难,尤其是图像的数据量非常大的时候,其一,手工对图像进行注释所需的工作量太大;其二,许多图像很难用文字的方式进行描述;其三,不同的人对同一幅图像的理解不一样,即使同一个人对同一幅图像在不同环境下理解也不完全相同,这样使得对图像的描述不唯一,造成检索结果的千差万别;其四,由于世界上存在许多语种,采用不同的语言文字对图像进行描述而建立的索引在应用中造成了一定的阻碍。因此基于文本方式的图像检索存在很大的局限性。 90年代初期,随着大规模数字图像库的出现,上述的问题变得越来越尖锐。为克服这些问题,基于内容的图像检索技术(content-based image retrieval)应运而生。区别于原有系统中对图像进行人工标注的做法,基于内容的检索技术

图像检索

所谓bag of word认为 文档就是一个词的集合,忽略任何语法或者出现顺序关系。 摘要 本文描述一种物体和影像搜索方法,即搜索并将用户在一个影像中看到的大致图像的所有点局部化。物体是由一系列视觉不变的区域点来代表的,所以即使在视角、光照和空间闭合上发生了改变,图像还是能够被成功辨别出来。在某一个视觉内的图像的局部连续性被用于追踪某些区域点,以便排除易变的区域点和减少在描述过程中噪音的影响。 该方法与文本检索的类似之处在于对被预先计算(利用矢量化)的描述点的匹配方法,和反序的文件系统以及文档排序都被使用。结果是检索是即时的,利用谷歌的方式返回一个关键电影画面或者关键点的排序列表。 下面以匹配两个标准长度的故事片来阐述这个方法。 1.介绍 我们的目标是检索出在包含了一个在位移、速度和精确度上都具有特殊性的物体的视频里面的关键电影画面和点,正如谷歌也利用位移、速度和精确度来检索包含了关键字的文本文档(网页)。该论文研究的是文本检索方法是否能够被成功应用于物体识别。 识别图像库里的一个(可识别的)物体的技术,现在已经大致成熟,但仍存在一些值得攻破的难题,因为视角和光照或者局部损坏,一个物体的视觉外观可能会非常不同,但是成功(识别)的方法现在还是存在的。一个物体通常由一系列交叉区域来表示,每个区域又由通过计算区域外观所得的一个矢量来表示。这个区域段和描述点是依据在一定视角和光照条件下设定的等级可控的空间不变性来构建的。类似的描述点被计算以供数据库里面的所有图像使用。通过描述向量的就近匹配,或者本地空间连贯性(例如邻接点、顺序或者空间布局)进行排歧,又或者全局关系(例如对极几何)来识别一个特定的物体。 例子包括[5, 6, 8, 11, 13, 12, 14, 16, 17]。 我们探索的是这类识别方法是否像文本检索那样被重铸。实际上,这要求一个单词的视觉类比,在这里我们通过矢量化描述向量提供这种类比。然而,人们将看到,现在做得更多的是与文本检索进行类比而不是在不同的向量矢量化(算法)上进行最优化。目前有很多在文献检索中已经被学习和发展了的经验教训和翻阅规则,这些值得被进一步确定是否同样能够应用于视觉检索中。 这种方法的好处是通过预计算,匹配是有效的,因此在包含任何特定物体的电影画面和视觉中,检索是无延迟的。这意味着任何出现在视频中的物体(包括多个物体的同时出现)都能够被检索出来,即使这些物体在构建对视频的描述时并没有明显的用处。然而,我们还是必须确定这些已经被矢量化了的向量是否遗漏了任何匹配,而这些匹配恰恰是使用最近邻接匹配的前一种方法能够获得的。 文本检索的回顾:文本检索系统一般采用的是一系列标准的步骤。文档首先被解析为一个个单词,然后这些单词用它们的原始词表示,比如单词“walk”、“walking”以及“walks”均被表示为“walk”。第三步,建立一个(索引中不列出的)省略词语表用来排除非常常用的单词,如“the”和“an”,这些几乎在大部分文档中都会出现,所以在一篇特定的文档中不再识别它们。那些剩下的单词则被指定一个唯一的识别符,然后每篇文档被表示为依据单词在文档中的出现频率得出的一个向量。此外用多种方法去权衡向量的构成部分(第4节将详细介绍),在谷歌的解决方案中,一个网页的权值由该网页的链接数来决定。所有以上步骤在实际检索前进行,表示文献库里面的所有文档的向量集被像一个反向文件那样组织以便帮助有效的检索。一个反向文件在结构上像一个理想的书目,反向文件中有每个单词在文库中的入口和所有文档的列表(以及单词在某一篇文档中出现的位置)。 通过计算由单词频率得到的向量来检索文本,并返回拥有最接近向量集(通过角度来测

基于颜色特征的图像检索算法的实现

目录 摘要 (1) 关键字 (1) 1绪论 (1) 1.1 基于内容的图像检索的概念 (1) 1.2 基于内容的图像检索的发展历史 (1) 1.3 基于内容的图像检索的特点和主要应用 (1) 1.4 基于内容的图像检索的关键技术 (2) 1.5 国内外研究现状 (3) 1.5.1 国外研究现状 (3) 1.5.2 国内研究现状 (4) 2 基于颜色特征的图像检索方法 (4) 2.1 颜色度量体系 (4) 2.2 颜色空间 (5) 2.2.1 RGB颜色空间 (5) 2.2.2 HSV颜色空间 (5) 2.2.3 CMY颜色空间 (6) 3 颜色特征的表达 (7) 3.1 颜色直方图 (7) 3.2 累加直方图 (8) 4 图像特征的相似性匹配 (9) 4.1 距离度量方法 (9) 4.2直方图的交集的方法 (9) 4.3 欧式距离法 (9) 5 图像检索算法实现 (10) 5.1程序开发运行环境 (10) 5.2 程序检索逻辑 (10) 5.3 算法具体实现 (11) 5.4 实例演示 (14) 6 全文总结与展望 (15) 6.1 全文总结 (15) 6.2 展望 (15) 致谢 (15) 参考文献 (16) 英文摘要 (16)

基于颜色特征的图像检索算法的实现 摘要:文章介绍了一种基于颜色特征的图像检索技术的算法并给出了程序实现。首先介绍了基于内容的图像检索技术、发展历史及基于内容的图像检索技术的特点和主要应用,并在此基础上探讨了该领域所用到的一些关键技术。文章着重探讨了图像的颜色空间、图像特征提取及图像相似性度量等内容,并利用matlab技术实现了一个简单图像检索的程序。文章最后则对当前基于内容图像检索技术研究热点和今后的发展方向进行简单的阐述。 关键字:基于内容的图像检索;颜色特征;颜色直方图;相似度度量方法 1 绪论 1.1 基于内容的图像检索的概念 基于内容的图像检索[1](Content Based Image Retrieval, CBIR)是一项从图像数据库中找出与检索式内容相似的图像的检索技术。它利用从图像中自动抽取出来的底层特征,如颜色、纹理、轮廓和形状等特征,进行计算和比较,检索出符合用户需求的结果图像集。目前图像检索系统技术实现的基础是对底层特征信息的计算和比较,也即是“视觉相似”。 1.2 基于内容的图像检索的发展历史 图像检索技术的发展[2]可以分为两个阶段,第一阶段始于70年代,当时的图像检索是通过人工的标注来实现的,随着计算机技术和通信网技术的发展,特别是因特网的快速发展,图像数据的容量越来越大了,这种“以关键字找图”的方法越来越不适应检索技术的发展了。由于图像内容的丰富内涵以及人们对图像内容进行抽象时的主观性不同的人对同一幅图像有不同的理解,这就引入了主观多义,不利于检索。为了克服文本标注检索的弊端,90年代研究者提出了基于内容的图像检索,其方法是:根据图像的颜色特征、纹理特征、形状特征以及空间关系等作为索引,计算查询图像和目标图像之间的相似距离,然后按相似度匹配进行检索,这种技术很大程度地利用了人们的视觉客观特性,避免不同人对图像主观理解的不同而达不到理想的搜索效果。从研究方向的层面来看,基于内容的图像检索可分为三层:第一层是根据图像的底层特性来进行检索,如颜色、纹理,形状等等,涉及图像信息处理、图像分析和相似性匹配技术;第二层是基于图像对象语义,如图像中实体及实体之间的拓扑关系的检索,对象级检索技术建立在下层特征基础上,并引入了对象模型库、对象识别和人工智能等图像理解技术;第三层是基于图像的抽象属性如行为语义,情感语义和场景语义的推理学习来进行检索。需要用到知识库和更加有效的人工智能和神经网络技术。这三个层次由低到高,与人的认知接近,下一个层次通常包含了比上一个层次更高级的语义,更高层的语义往往通过较低层的语义推理获得。尽管经过了多年的研究,较为成熟的基于内容的图像检索技术目前仍处于底层水平,由于底层研究是上层研究的基础,为了给上层建立准确、有效的图像特征提取方法,底层的研究仍在不断的发展。 1.3 基于内容的图像检索的特点和主要应用 基于内容的图像检索技术有以下特点[3]: 一是它突破了传统的基于表达式检索的局限,从媒体内容中提取信息线索。

基于颜色特征的图像检索

基于颜色特征的图像检索

摘要 随着多媒体及网络技术的发展,互联网中的图像等多媒体信息的数量在迅速增加。如何在庞大的多媒体数据资源海洋中搜索到自己所需要的图像,随之成为一个函待解决的问题。近年来基于内容的图像检索技术己经成为了研究的热点,该技术具有传统文本检索方式所无法比拟的优越性,目前已被应用于多媒体通信、生物识别、知识产权保护等方面,具有广阔的发展前景。 本课题设计了基于颜色特征的图像检索系统,该系统主要包括两个关键步骤:颜色特征的提取和相似度匹配。本文中首先采用应用广泛的HSV颜色空间来表示图像的颜色特征,对颜色分量进行非等间隔量化形成特征矢量;然后用欧式距离度量函数进行图像的相似性匹配;最后在MATLAB平台下编程实现了基于颜色特征的检索系统。根据用户输入的样本图像与图像库中的图像进行特征匹配,找出与样本图像距离比较小的若干幅图像,并按照图像之间的距离由小到大的顺序显示给用户。 关键词:图像检索;直方图;颜色特征;MATLAB I

ABSTRACT With the development of multimedia technology, In Internet the number of images and other multimedia information in the rapidly increasing. How to locate the useful image in the vast multi-media is a great technology problem. In recent years, Content-based image retrieval has become a research focus, the technology has the superiority which the traditional text retrieval methods can not match.It has been widely used in multimedia communications, biometrics, intellectual property protection and so on, and has broad prospeets for development. This topic is designed based Color Image Retrieval System, which includes two key steps: color feature extraction and similarity matching. In this article was first used widely HSV color space to represent color feature image. We carried out color components quantification of non-interval to form feature vector; Then use the Euclidean distance metric function to match the similarity function of the image. Finally, this system should be implemented under the platform of the MATLAB by programming. Under user input sample image to conduct feature matching with image which in library images. In this system, It also can identify the images that have a short distance to the sample images, And in accordance with the distance between the images displayed to the user in the order from small to big. Keywords:Image Retrieval;Histogram Algorithm;Color Features;MATLAB II

基于内容的图像检索技术

第二部分 基于内容的图像检索技术 近年来,随着多媒体技术和计算机网络的飞速发展,全世界的数字图像的容量正以惊人的速度增长。无论是军用还是民用设备,每天都会产生容量相当于数千兆字节的图像。这些数字图像中包含了大量有用的信息。然而,由于这些图像是无序地分布在世界各地,图像中包含的信息无法被有效地访问和利用。这就要求有一种能够快速而且准确地查找访问图像的技术,也就是所谓的图像检索技术。自从20世纪70年代以来,在数据库系统和计算机视觉两大研究领域的共同推动下,图像检索技术已逐渐成为一个非常活跃的研究领域。数据库和计算机视觉两大领域是从不同的角度来研究图像检索技术的,前者基于文本的,而后者是基于视觉的。 基于文本的图像检索技术(text-based image retrieval)的历史可以追溯到20世纪70年代末期。当时流行的图像检索系统是将图像作为数据库中存储的一个对象,用关键字或自由文本对其进行描述。查询操作是基于该图像的文本描述进行精确匹配或概率匹配,有些系统的检索模型还是有词典支持的。另外,图像数据模型、多维索引、查询评价等技术都在这样一个框架之下发展起来。然而,完全基于文本的图像检索技术存在着严重的问题。首先,目前的计算机视觉和人工智能技术都无法自动对图像进行标注,而必须依赖于人工对图像做出标注。这项工作不但费时费力,而且手工的标注往往是不准确或不完整的,还不可避免地带有主观偏差。也就是说,不同的人对同一幅图像有不同的理解方法,这种主观理解的差异将导致图像检索中的失配错误。此外,图像中所包含的丰富的视觉特征(颜色或纹理等)往往无法用文本进行客观地描述的。 90年代初期,随着大规模数字图像库的出现,上述的问题变得越来越尖锐。为克服这些问题,基于内容的图像检索技术(content-based image retrieval)应运而生。区别于原有系统中对图像进行人工标注的做法,基于内容的检索技术自动提取每幅图像的视觉内容特征作为其索引,如色彩、纹理、形状等。此后几年中,这个研究领域中的许多技术发展起来,一大批研究性的或商用的图像检索系统被建立起来。这个领域的发展主要来归功于计算机视觉技术的进步,在文献[]中有对这一领域的详细介绍。 应该认识到,基于内容的图像检索系统具有与传统基于文本的检索系统完全不同的构架。首先,由于图像依赖其视觉特征而非文本描述进行索引,查询将根据图像视觉特征的相似度进行。用户通过选择具有代表性的一幅或多幅例子图像来构造查询,然后由系统查找与例子图像在视觉内容上比较相似的图像,按相似度大小排列返回给用户。这就是所谓的通过例子图像的检索(query by image example)。另外,基于内容的检索系统一般通过可视化界面和用户进行频繁的交互,以便于用户能够方便地构造查询、评估检索结果和改进检索结果。 下图表示了基于内容的图像检索系统的体系结构。系统的核心是图像特征数据库。图像特征既可以从图像本身提取得到,又可以通过用户交互获得,并用于计算图像之间的相似度。用户和系统之间的关系是双向的:用户可以向系统提出查询要求,系统根据查询要求返回查询结果,用户还通过对查询结果的相关反馈来改进查询结果。图中还标出了基于内容的图像检索中的一些关键环节: 1) 选择、提取和索引能够充分表达图像的视觉特征。

毕业设计(论文)-基于颜色特征的图像检索方法研究与实现

本科毕业论文 (科研训练、毕业设计) 题目:基于颜色特征的图像检索 方法研究与实现 姓名: 学院:信息科学与技术 系:计算机 专业:计算机 年级:2004 学号:04120074 指导教师(校内):职称:教授 指导教师(校外)职称: 年月日

基于颜色特征的图像检索方法研究与实现 【摘要】本文介绍了一个基于改进的加权颜色直方图的图象检索系统。 本系统通过将基于改进的加权的局域颜色直方图的图像检索方法和全局直方图的图像检索方法相结合,提高查全率和查准率。其中,基于分块局域直方图的检索方法利用了图像中间部分的重要性,将图像平均划分成3×3个子块,取中间一块的图像,计算其与参考位图相应位置的颜色特征距离,再计算原图的颜色直方图与参考位图的颜色特征距离,分别赋予权值后得出的值就是图像之间内容的相似程度。本文引入欧氏距离的相似性度量方法实现图像检索。实验表明,该方法具有较好的查全率和查准率。 【关键字】图像检索,颜色特征,颜色直方图,相似性度量方法

CONTENT-BASED IMAGE RETRIEV AL SYSTEM LEARN AND REALIZATION ABSTRACT This image retrieval system is based on a improved weighted color histogram. With combining the improved image retrieval algorithem of based on the weighted central-block color histogram and the image retrieval algorithem of overall histogram, the recall rate and the rate of search is improved . Using the importance of the image of the middle part, the retrieval method based on the block local histogram divide a picture into an average o f 3 × 3 sub-blocks. Choose the middle one , calculate the colour feature distance between the middle block of original image and the middle block of reference image .Then calculate the colour feature distance between the original image and reference image. Weighted with fixed value , we can get the similarity between them. We introduce the Euclidean distance measurement methods to achieve similar image retrieval. The experiments show that the method has a better recall rate and the rate of search. Keywords: Image Retrieval, features of color,color histogram, similar methods of measurement

基于内容的图像检索技术研究

基于内容的图像检索技术研究 学号:10404400204 姓名:陈萍班级:数字媒体艺术1002班学院:包装与材料工程 〔摘要〕基于内容的图像检索技术是对图像的物理内容为加工对象的检索技术之一,主要实现方式包括基于颜色、纹理、形状和语义等。其中基于颜色的图像检索发展最为成熟,而基于语义的检索则尚处于探讨、研究阶段。 关键词:图像检索、内容、语义 引言 随着信息技术的普及与发展及应用,数字图像的数量正以惊人的速度增长。如何将数字图像处理、计算机视觉技术与传统数据库技术相结合,建立基于对图像内容自动或半自动描述的新一代图像视频数据库成为现在亟待解决的课题。基于内容的图像检索(CBIR)是解决这一问题的关键技术之一。CBIR与传统的检索手段不同,它是利用图像的颜色、纹理、形状等基本特征进行检索,并把这些量化特征与图像存储在一起,它的特点是:直接从媒体内容中提取信息线索。基于内容的检索是一种近似匹配;特征提取和索引建立常需要用人机交互的方法,学习人的主观相似度感受。它主要使用的是基于相似度量的示例查询方法。 2 基于内容的图像检索技术 基于内容的图像检索的前提是基于内容的描述。图像内容既包括了颜色、纹理、形状等低层次视觉特征,又包括了对目标意义的复杂推理等的高层语义特征。检索进行查询的层次基本可分为三层: (1 )基于原始数据的查询。这是最低层次的查找,每一幅图像为像素点的简单有序的集合体,查询时相似性的度量标准是点对点的比较,这个层次的比较是非常具体的,只有在使用相对精确匹配时才有用。 (2 )基于特征的查询。这是较高层次的查询,在基于特征的层次上描述图像。图像特征包括原始属性:颜色、纹理、形状等,也包括脱离了原始性的抽象属性:灰度直方图,颜色直方图,空间频谱图。不同的特征可以被分成不同的特征矢量组。图像的区域划分基本上是根据特征矢量的不同特征,同一个区域内的特征矢量具有相同的属性。在n维特征空间的查询,实质上就是目标特征矢量的相似性度量。数据库内的图像文件的特征矢量集以及抽取方法,被事先抽取并保存,查询时,使用给出的模板,图像按照库内保存的方法抽取目标特征矢量。(3 )基于语义的查询。这是最高层次的查询,可以看作是基于对象的查询。查询图像中包括的具体的物体,发生的场景,图像所描述的感性色彩等都属于这个层次的查询。目前实现图像检索的手段有很多,包括基于分数维的图像检索,基于多颜色空间的图像检索方法,基于内容的图像检索,基于区域的图像匹配算法的关键技术研究,基于颜色特征的图像检索方法等等。而且基于图像处理技术的日趋成熟,检索的效果也越来越好,但仍未到图像语义的图像检索阶段。 2.1 基于颜色特征 颜色是一种重要的,目前使用最广的视觉特征,同一类事物通常有着相似或相同的颜色特征。因此可以利用颜色特征来区分不同物体, 也是绝大多数基于内容的图像和视频检索的多媒体数据库中使用的特征之一。颜色往往和图像中所包含的物体或场景十分相关,颜色特征对图像本身的尺寸、方向、视角的依赖性较小,从而具有较高的鲁棒性。基于颜色特征的检索主要采用的方法包括颜色直方图、颜色矩、颜色相关图等。颜色直方图是在许多图像检索系统中被广泛采用的颜色特征,特别适于描述那些难以进行自动分割的图像。 2.2 基于形状特征 形状是刻画物体的本质特征之一,在二维图像空间中,形状通常被认为是一条封闭的轮廓曲线所包围的区域,所以对形状的描述涉及到对轮廓边界的描述以及对这个边界所包围区域的描述。目前的基于形状检索方法大多围绕着从形状的外轮廓特征和形状的区域特征建立

原型基于颜色的图像检索与MATLAB

Prototyping Color-based Image Retrieval with MATLAB? Petteri Kerminen1, Moncef Gabbouj2 1Tampere University of Technology, Pori, Finland 2Tampere University of Technology, Signal Processing Laboratory, Tampere, Finland

Abstract Content-based retrieval of (image) databases has become more popular than before. Algorithm develop-ment for this purpose requires testing/simulation tools,but there are no suitable commercial tools on the market. A simulation environment for retrieving images from database according histogram similarities is presented in this paper. This environment allows the use of different color spaces and numbers of bins. The algorithms are implemented with MATLAB. Each color system has its own m-files. The phases of the software building process are pre-sented from system design to graphical user interface (GUI). The functionality is described with snapshots of GUI. 1. Introduction Nowadays there are thousands or hundreds of thousands of digital images in an image database. If the user wants to find a suitable image for his/her purposes, he/she has to go through the database until the correct image has been found or use a reference book or some “intelligent” program. Video on demand (VoD) services also requires an intelligent search system for end-users. VoD systems’ search methods differ slightly from image database’s methods. A reference book is a suitable option, if the images are arranged with a useful method, for example: 1)categories: animals, flags, etc, 2) names (requires a good naming technique) or 3) dates. An experienced user can use these systems as well as textual searches (keywords have to be inserted in a database) efficiently. There are situations when a multi-language system has to be used. There a language independent search system’s best properties can be utilized. A tool which is based on the images’ properties can be made

中英文文献翻译-原型基于颜色的图像检索与MATLAB

英文原文 Prototyping Color-based Image Retrieval with MATLAB Abstrac Content-based retrieval of (image) databases has become more popular than before. Algorithm develop-ment for this purpose requires testing/simulation tools,but there are no suitable commercial tools on the market. A simulation environment for retrieving images from database according histogram similarities is presented in this paper. This environment allows the use of different color spaces and numbers of bins. The algorithms are implemented with MA TLAB. Each color system has its own m-files. The phases of the software building process are pre-sented from system design to graphical user interface (GUI). The functionality is described with snapshots of GUI. 1. Introduction Nowadays there are thousands or hundreds of thousands of digital images in an image database. If the user wants to find a suitable image for his/her purposes, he/she has to go through the database until the correct image has been found or use a reference book or some “intelligent” program. Video on demand (V oD) services also requires an intelligent search system for end-users. V oD systems’ search methods differ slightly from image database’s methods. A reference book is a suitable option, if the images are arranged with a useful method, for example: 1)categories: animals, flags, etc, 2) names (requires a good naming technique) or 3) dates. An experienced user can use these systems as well as textual searches (keywords have to be inserted in a database) efficiently. There are situations when a multi-language system has to be used. There a language independent search system’s best properties can be utilized. A tool which is based on the images’ properties can be madelanguage independent. These properties can be for example color, shape, texture, spatial location of shape etc. In the MuVi-project [1] this kind of tool is under construction. It will cover the properties presented above.Research work on content-based image retrieval has been done in [2 – 6]. The system, which is present ed in this paper, is a simulation environment, where MuVi’s color content based retrieval has been developed and tested. 2. System development MATLAB is an efficient program for vector and matrix data processing. It contains ready functions for matrix manipulations and image visualization and allows a program to have modular structure. Because of these facts MATLAB has been chosen as prototyping software. 2.1 System design Before any m-files have been written, the system designhas been done. A system design for the HSV (hue, saturation and value) color system based retrieval process is presented in Figure 1. Similar design has been done for all used color systems.

相关主题