一种基于稀疏重构的头部姿态估计方法
摘要:本文针对头部姿态估计问题中侧面人脸图像存在背景影响的问题,基于稀疏表示理论提出一种去除侧面人脸图像中的背景的方法,从而有效地提高了头部姿态估计的准确率。该方法的动机在于,使用人脸检测算法检测到的人脸中往往存在有背景信息。在使用稀疏表示理论对侧面的人脸图像进行重构和分类时,由于字典集中没有背景信息,因此侧面人脸图像中的背景信息的重构误差较大。本文提出的方法通过对重构误差的分析,能够有效地确定背景的位置和大小等信息。进而通过人脸的二次定位,有效的减少了头部图像中背景信息,使输入姿态估计分类器的样本更加有效。实验结果表明,本文的方法能够通过去除侧面人脸图像中的背景信息,有效地提高头部姿态估计的准确率。
关键词:头部姿态估计;稀疏表示;重构误差;
0引言
统计表明,大约75%的人脸图像为非正面的人脸图像[1]。在过去的十几年里,虽然人脸识别问题的研究取得了巨大的进步,但是在姿态变化时进行鲁棒的人脸识别仍然十分困难。由于准确估计输入图像的姿态是解决这些问题的先决条件,因而姿态估计受到了越来越多的关注。人脸姿态估计是指从输入的图像中确定人脸在三维空间中姿态的过程。头部的旋转通常分成三种类型:左右旋转(yaw rotation)、上下旋转(pitch rotation)和平面内旋转(roll rotation)。由于平面内旋转可以根据眼睛的相对位置计算得到,因而姿态估计方法通常集中在估计头部的左右旋转和上下旋转上。姿态估计的方法通常可以分成两种类型[2]: 基于模型的方法(model-based method) [2, 3]和基于表观的方法(appearance-based method) [4, 5]。基于模型的方法利用某种几何模型或结构表示人脸的结构和形状,并通过提取某些特征,在模型和图像之间建立起对应关系,然后通过几何或者其他方法实现姿态的估计。基于表观的方法则是假定在3D的头部姿态和2D人脸图像的某些性质之间存在一定的联系,并认为通过大规模训练集上的学习可以找到这种联系,其通常使用统计学习理论提取特征。虽然头部姿态估计系统的准确度与提取姿态特征的特征提取算法和姿态分类(回归)算法的性能有关,但是输入系统的头部图像的配准程度也会显著影响系统的性能。在全自动的姿态估计系统中,输入系统的头部图像为人脸检测算法的输出结果。在使用现有的人脸检测算法进行人脸检测时,人脸图像中往往会背景信息。一方面,背景信息的存在表明图像的配准程度较差,从而影响了姿态估计的准确率。另外一方面,背景信息也影响特征提取算法提取的特征的表述能力。当样本中含有大量非人脸信息时,势必会显著降低姿态估计准确度。因此,多姿态人脸图像中的背景信息的去除,对于提高姿态估计的准确率是一个重要的问题。本文针对头部多姿态估计问题[6],提出了一种使用稀疏表示理论进行背景去除的姿态估计方法。该方法中,在对样本进行预处理的过程中,除了传统的处理步骤,我们提出通过稀疏表示所产生的图像重构误差分析测试图像中人脸的背景区域,并进行相应的移动和裁剪,以达到降低人脸图像中背景信息,增加有效人脸面积的目的。为验证提出算法的有效性,我们在人脸多姿态数据库上进行了实验。实验结果表明,该方法通过对背景信息的去除,可以在显著提高姿态估计的准确率。
4 结论
本文针对头部多姿态估计的问题,提出了一种基于稀疏重构的姿态估计方法。该方法通过分析稀疏表示时的重构误差,去除多姿态图像中的背景信息,从而降低由于图像的误配准引起的错误。在多姿态数据上的实验结果证明,该方法能在一定程度上提高头部多姿态估计的准确率。虽然本文提出的方法对于多姿态图像能够有效的消除背景,并进一步提高姿态估计的准确率,但是仍然有下述的问题值得进一步研究:1)本文提出的方法仅在限定上下方向的姿态图像上进行实验,如何将本文的方法扩展到所有姿态的图像上,仍然是个值得研究的问题;2)本文的方法目前仅限于PCA和LDA等线性降维的方法,如何对其他方法提取的特征,如Gabor特征等,进行切割,仍然需要进一步的研究。
参考文献(References)
[1] 马丙鹏,山世光,陈熙霖,高文. 一种基于图像表观的鲁棒姿态估计方法. 软件学报,06:1651{1663, 2009.
[2] Q. Ji and R. Hu. 3d face pose estimation and tracking from a monocular camera. Image and Vision Computing, 20(7):499{511, 2002.
[3] J. Xiao, T. Moriyama, T. Kanade, and J.F. Cohn. Robust full-motion recovery of head by dynamic templates and re-registration techniques. International Journal of Imaging Systems and Technology, 13(1):85{94, 2003.
[4] S. Srinivasan and K.L. Boyer. Head pose estimation using view based eigenspaces. Pro-
ceedings International Conference on Pattern Recognition, 4:302{305, 2002.
[5] Y.Wei, L. Fradet, and T. Tan. Head pose estimation using Gabor eigenspace modeling. In
Proceedings International Conference on Image Processing, volume 1, pages I{281 { I{284.IEEE, 2002.
[6] 陈熙霖,山世光,高文. 多姿态人脸识别. 中国图象图形学报, 4(10):818{824, 1999.
[7] S. Yan, S. Shan, X. Chen, W. Gao, and J. Chen. Matrix-structural learning (MSL) of cascaded classi er from enormous training set. In IEEE Conference on Computer Vision
and Pattern Recognition, pages 1{7. IEEE, 2007.
[8] M. Turk and A. Pentland. Eigenfaces for recognition. Journal of cognitive neuroscience,3(1):71{86, 1991.
[9] J. Wright, A.Y. Yang, A. Ganesh, S.S. Sastry, and Y. Ma. Robust face recognition via
sparse representation. IEEE Transactions on Pattern Analysis and Machine Intelligence,31:210{227, February 2009.
[10] P.N. Belhumeur, J.P. Hespanha, and D.J. Kriegman. Eigenfaces vs. Fisherfaces: Recog-
nition using class speci c linear projection. IEEE Transactions on Pattern Analysis andMachine Intelligence, 19(7):711{720, 1997.
原创学术论文网Tag:
|