推荐期刊

图像数据的混沌模式的提取与表达

时间:2019-11-22 10:40:09 所属分类:计算机网络 浏览量:

摘 要: 研究以离散余弦变换( DCT) 基函数作为辅助函数,结合序列灰度图像构造动力系统,然后迭代得到轨迹点集合( 近似的吸引子) ; 使用该吸引子能够将视频图像的不同场景鉴别出来,用于视频分段裁剪等。使用多个 DCT 基函数矩阵,分别与一个图像构造动力系统

  摘 要: 研究以离散余弦变换( DCT) 基函数作为辅助函数,结合序列灰度图像构造动力系统,然后迭代得到轨迹点集合( 近似的吸引子) ; 使用该吸引子能够将视频图像的不同场景鉴别出来,用于视频分段裁剪等。使用多个 DCT 基函数矩阵,分别与一个图像构造动力系统,生成多个近似吸引子,这些吸引子可以作为图像的特征,用于图像识别,也可以重构原图像。

  关键词: 图像数据; 混沌吸引子; 离散余弦变换基函数

图像数据的混沌模式的提取与表达

  1 动力系统构造与迭代方法

  下面使用 DCT 基函数矩阵与图像矩阵构造动力系统。DCT 基函数矩阵的定义如下:

  R( m,n) = αpαq cos π( 2m + 1) p 2 [ ] M cos π( 2n + 1) q 2 [ ] N ( 1) 其中,0 ≤ p ≤ M - 1,0 ≤ q ≤ N - 1 , αp = 1 槡M ,p =0 2 槡M { ,1 ≤p≤M - 1 ,αq = 1 槡N ,q = 0 2 槡N { ,1 ≤ q≤N - 1 。固定 p,q 后,R( m,n) 都可以看作是以 m,n 为自变量的二元离散函数。这里令 m,n,p,q 均为正整数。随着 p, q 的变化,基函数( 矩阵) 也随之变化,共 M × N 个,选取一个,与灰度图像矩阵构造动力系统,如式( 2) 所示: z1 = f( x,y) z{ 2 = g( x,y) ( 2) 式( 2) 中,f( x,y) 表示离散余弦基函数矩阵,g( x,y) 表示灰度图像矩阵。

  算法 1 利用 DCT 基函数与图像构造动力系统,然后迭代,生成迭代序列 ( 1) 给定 p,q 的值以及 M,N 的值,此处取 M = N = 256。 ( 2) 计算 DCT 基函数矩阵 A,并用插值方法将其元素值调整到 1 ~ 256 之间。 ( 3) 读入图像,适当裁剪边缘,以便生成质量更好的吸引子。 ( 4) 将裁剪后的图像调整到 M × N 大小,记为 H; 将图像调整为 1 ~ 256 大小是为了使其与像素值一致,便于下面的迭代操作。 ( 5) 给定初始迭代值( u,v) ,代入矩阵 B,即把( u,v) 作为下标,取出矩阵 B 在( u,v) 的元素值,记为 z1; 再将初始迭代值( u,v) 代入矩阵 H,即把( u,v) 作为下标,取出矩阵 H 在( u,v) 的元素值,记为 z2。 ( 6) 将( z1,z2) 的值赋值给( u,v) ,将每次的( z1,z2) 记载下来,然后转到步骤( 5) 。 ( 7) 将第( 6) 步重复执行 n 次。

  2 视频图像特征提取

  例如,使用 DCT 基函数作为辅助函数,对一视频图像进行处理,即按照一定时间间隔从视频图像中取出图像,与 DCT 基函数构成动力系统,使用算法 1,迭代生成吸引子,不同场景下的视频图像其吸引子区别也比较大,如图 1 所示。图 1 中的图像取自于一段视频。一般情况下,越复杂的图像,越容易产生吸引子。算法 2 视频图像场景变化检测 ( 1) 给定 p,q 的值,给定 M,N 的值,生成基函数矩阵 A,将矩阵 A 的值调整为 1 ~ M,此处 M、N 的值视图像而定,例如 M 为每帧图像的高,N 为宽。

  ( 2) 读入视频图像的三帧,转变为灰度图像,将图像的灰度值调整为 1 ~ N,记做 B; 分别与矩阵 A 构成动力系统,迭代生成近似吸引子,记做 T1、T2、T3。 ( 3) 将 T1、T2、T3 进行二维傅里叶变换,得到变换后的矩阵 F1、F2、F3。 ( 4) 计算 F1、F2 的相关系数,记为 C1; 再计算 F2、F3 的相关系数,记为 C2。 ( 5) 计算 C1 与 C2 差值绝对值 D1,C2 与 C3 的差值绝对值 D2。 ( 6) 如果 D1 远小于 D2,那么 T1、T2 场景相同,T2、T3 场景不同; 如果 D1 与 D2 的差值较小,那么 T1、T2、T3 场景相同。

  3 图像的分解与重构

  下面使用多个 DCT 基函数矩阵,分别与一个图像构造动力系统,生成多个近似吸引子,然后再使用这些吸引子,重构原图像。以 Lena 图像作为被处理函数,为了便于分析,对 Lena 图像进行了截取; 与 256 × 256 的 DCT 基函数矩阵构造动力系统,p,q 的值分别为( 2,2) 、( 3,3) 、( 4,4) 、( 5,5) 、( 6, 6) 、( 7,7) ,使用算法 1,得到的近似吸引子点阵如图 2 所示。

  吸引子用二维点集的形式表现,但是如果记录下这些点的先后顺序,便可以表达( 记载) 图像的灰度信息。图 3就是根据吸引子点产生的先后顺序,将二维吸引子转化为三维点阵; ( x,y) 是图像的像素位置,z 轴是图像的灰度值。这些位置与灰度值来源于图像,可以表达图像的某种特征,也可以近似复原图像。

  利用图 3 所示的吸引子三维点阵,可以近似复原图像。例如,使用语句 for p = 1 to 2,for q = 1 to 2,嵌套循环,即利用( p,q) 为( 1,1) ,( 1,2) ,( 2,1) ,( 2,2) 这 4 个 DCT 基函数矩阵,复原后效果如图 4( a) 所示; 利用 for p = 1 to 5,for q = 1 to 5 嵌套循环,得到 25 个 DCT 基函数矩阵,复原效果如图 4( b) 所示; 利用 10 × 10 = 100 个吸引子复原效果如图 4( c) 所示; 利用 15 × 15,30 × 30,40 × 40 个吸引子的复原效果分别如图 4( d) 、( e) 、( f) 所示。

  在图像复原的时候,如果绘制出一个点,将这个点的周围点也绘制出来,可以加速图像复原。例如,当每次绘制周围的 3 × 3 个点时,使用前 100 个( p,q) 就可以绘制出如图 5( a) 所示效果,与图 4( c) 相比,复原效果更好。如果绘制每点周围 5 × 5 个点,那么使用前 49 个( p,q) 就可以复原出如图 5( b) 所示效果。 49 个近似吸引子叠加在一起,能够重构图像轮廓; 这意味着 49 个稀疏的三维数组代表着一个 Lena 图像; 需要的时候组合,不需要的时候可以分散放到吸引子库中。

  4 结论

  在已有文献的基础上,将辅助函数改为离散余弦变换基函数,与图像构造动力系统,得到的近似吸引子可以作为视频图像分割的依据。这种方法与其他图像特征提取方法存在着本质上的不同。视频图像数据是一种大数据,既然这种方法可以应用于图像处理、图像模式提取,那么也可以经过改进后,用于其他数据处理。进一步的工作是,改进这种数据存储与表达方式,尝试建立一种新的索引方式,即点阵与概念索引方式。例如“脸”这个概念,是否对应着“高一级”的点阵,即吸引子点阵的一种索引结构。这是一种特征提取与存储方法,是否可以成为一种数据分解与重构的方法还有待于进一步研究。

  参考文献

  [1]KOMMINENI J,SATRIA M,MOHD S S. Content based image retrieval using colour strings comparison[J]. Procedia Computer Science,2015,50: 374-379.

  [2]Wu Fei,Wang Zhuhao,Zhang Zhongfei,et al. Weakly semi - supervised deep learning for multi - label image annotation[J]. IEEE Transactions on Big Data,2015( 1) : 109-122.

  [3]TEMESGUEN M,RUSSEL C H,TIMOTHY R T. Segmentation of pulmonary nodules in computed tomography using a regression neural network approach and its application to the lung image database consortium and image database resource initiative dataset[J]. Medical Image Analysis,2015,22( 1) : 48-62.

  《图像数据的混沌模式的提取与表达》来源:《微型机与应用》,作者:于 硕 ,李思思 ,于万波。

转载请注明来自:http://www.zazhifabiao.com/lunwen/dzxx/jsjwl/45689.html