浅谈人脸识别(精选8篇)
1.浅谈人脸识别 篇一
人脸识别综述
王军军
(西安交通大学,西安,710086)
摘要:人脸识别已成为多个学科领域的研究热点之一,本文对人脸识别的发展历史、研究现状进行了综述,系统地对目前主流人脸识别方法进行了分类针对人脸识别面临的挑战,着重对近几年来在光照和姿态变化处理方面的研究进展进行了详细沦述,并对未来人脸识别的发展方向进行了展望。
关键词:人脸识别,人脸检测,模式识别
一、引言
人脸识别是近年来模式识别、图像处理、机器视觉、神经网络以及认知科学等领域研究的热点课题之一。所谓人脸识别,是指给定一个场景的静态图像或动态视频,利用存储有若干已知身份的人脸图像的数据库验证和鉴别场景中单个或者多个人的身份[1]。人脸识别按照人脸信息的来源可以分为两类:基于静态人脸图像的识别和基于包含人脸的动态视频信息的识别。因为动态视频信息并不能明显提高人脸识别的性能,因此本文只研究基于静态人脸图像的识别[2]。
作为生物特征识别的一个重要方面,人脸识别在档案管理系统、安全验证系统、信用卡验证、公安系统的罪犯身份识别、银行和海关的监控、人机交互等领域具有广阔的应用前景。与指纹识别、视网膜识别、虹膜识别等[3]技术相比,人脸识别技术在数据采集方面手续比较简单,使用者更容易接受。人脸作为生物特征,虽然唯一性比指纹和虹膜要差[4],在高安全性要求的系统中只能作为辅助手段。然而,对于一般安全性要求的身份验证和鉴别系统[5],人脸识别技术已经足够应用了。
人脸识别研究在二十世纪六七十年代引起了诸多学科领域研究者的浓厚兴趣。进人九十年代后,随着各行业对人脸识别系统的迫切需求,人脸识别研究再次成为热门课题。当前世界各国有许多研究机构在从事这方面的研究,这些研究受到军方、警方以及大公司的高度重视和资助[6]。美国军方还专门组织了人脸识别竞赛以促进人脸识别研究的发展。经过三十多年的研究,人脸识别已经成为图像分析与图像理解领域最成功的应用之一研究人员提出了很多识别方法,建成了一些实验系统,也有一些成功的人脸识别商业软件投人市场。
人脸识别作为模式识别的一种,一般可以分为三个组成部分:从场景中检测并分割人脸;抽取人脸特征;匹配和识别人脸[7]。由于人脸检测已经发展成为一个独立的课题,具有特定的思想和方法,所以本文假定人脸已经被正确检测并从场景中分割出来。
二、人脸识别的方法
目前,人脸识别的方法大致可以分为以下几类:基于几何特征的方法、基于模型的方法、基于统计的方法、基于神经网络的方法和多分类器集成的方法[8]。目前主流的方法有基于几何特征的方法和基于模型的方法。
2.1基于几何特征的方法
文献中记载最早的人脸识别方法就是Bledsoe[9]提出的基于几何特征的方法。该方法以面部特征点之间的距离和比率作为特征,通过最近邻方法来识别人脸,以该方法建立的人脸识别系统是一个半自动系统,面部特征点必须由人手工定位。也正是由于人工的参与,该系统对光照变化和姿态变化不敏感[10]。
侧影[11](Profile)识别也是早期基于几何特征人脸识别的一个重要方法,其基本原理是从人脸的侧影轮廓线上提取特征点,将侧影转化为轮廓曲线,从中提取基准点,根据这些点之间的几何特征来进行识别,由于侧影识别相对较简单且应用面小,对侧影识别的研究较少。
基于几何特征的方法非常直观,识别速度快,内存要求较少,提取的特征在一定程度上对光照变化不太敏感[12]。但是,当人脸具有一定的表情或者姿态变化时,特征提取不精确,而且由于忽略了整个图像的很多细节信息,识别率较低,所以近年来已经很少有新的发展。
2.2基于模型的方法
隐马尔可夫模型[13](Hidden Markov Model,HMM)是一种常用的模型,基于HMM的方法首先被用于声音识别等身份识别上,之后被Nefian和Hayes引人到人脸识别领域。它是用于描述信号统计特性的一组统计模型。HMM用马尔可夫链来模拟信号统计特性的变化,而这种变化又是间接通过观察序列来描述的,因此马尔可夫过程是一个双重的随机过程。在HMM中结点表示状态,有向边表示状态之间的转移,一个状态可以具有特征空间中的任意特征,对同一特征,不同形态表现出这一特征的概率不同[14]。在人脸识别过程中,Nefian首先采用两维离散余弦变换(Discrete Cosine Transform,DCT)抽取人脸特征,得到观察向量,构建HMM人脸模型,然后用EM(Expectation Maximization)算法训练,利用该模型就可以算出每个待识别人脸。观察向量的概率,从而完成识别。HMM方法的鲁棒性较好,对表情、姿态变化不太敏感,识别率高[15]。
主动形状模型[16](Active Shape Model, ASM)方法由Cootes等人提出,Cootes对形状和局部灰度表象建模,用建立的ASM在新的图像中定位易变的物体。后来,Lanitis等将其应用于解释人脸图像,在使用ASM找出人脸的形状后,将人脸切割并归一到统一的框架,对这个与形状无关的人脸采用亮度模型来进行解释和识别,其鲁棒性和识别效率均较高,但需要手动标会人脸的特征点,算法的自动化程度有待加强。
主动表象模型[17](Active Appearance Model, AAM)可以看成是对ASM的进一步扩展,是一种通用的非线性图像编码模式,通过变形处理将通用人脸模型与输人图像进行匹配,并将控制参数作为分类的特征向量。
2.3 基于统计的方法
基于统计的方法将人脸图像视为随机向量,从而用一些统计方法来分析人脸模式,这类方法有着完备的统计学理论支持;得到了较好地发展,出现了一些较成功的算法。
特征脸[18](Eigenface)方法由Turk和Pentland提出。对于每一幅人脸图像,按照从上到下、从左到右的顺序将所有像素的灰度值串成一个高维向量,然后通过主成分分析(Principal Component Analysis, PCA)将高维向量降低维数。用PCA[19]降维主要基于以下三点:(1)压缩功能,在低维空间内比较图像将提高计算效率;(2)人脸样本的分布近似正态分布,方差大的维可能与有用信号相关,而方差小的维可能对应噪声,因此去掉小方差对应的维将有利于提高识别精确率;(3)因为每幅图像都被减去均值,且被放缩成单位向量,两幅图像之间的相关性与特征空间中投影之间的距离成反比,因此特征空间中的最近邻匹配是图像相关性的有效近似。PCA技术首先由Kirby[20]和Sirovich引人到人脸识别领域,并且证明了PCA是使原始图像与重构图像之间的均方误差极小化的最佳压缩方式。一幅图像在各个特征脸上的投影组成了该图像的权值向量,将待识别图像的权值向量与人脸数据库中各图像的权值向量相比较,确定哪一幅图像与待识别图像的权值向量最接近。后来Pentland等人进一步扩展了特征脸方法,将类似的思想运用到面部特征上,分别得到了本征眼、本征鼻、本征嘴,并且将它们结合起来进行人脸识别。实验结果表明,这样比单独使用特征脸效果更好。特征脸方法计算量低,使用方便,并且效果良好,目前已经成为人脸识别的基准程序(Benchmark)和事实上的工业标准。但是它对于外界因素所带来的图像差异和人脸自身所造成的差异是不加区分的,因此外界因素(例如光照、姿态)变化会引起识别率的降低。
特征脸方法使用由各个特征脸扩展的空间来表示人脸,虽然可以有效地表示人脸信息,但是并不能有效鉴别和区分人脸。很多研究者提出了使用其他线性空间来代替特征脸空间以取得更好的识别效果。此中线性判别分析方法[21](也叫Fisher脸方法),利用了类别归属信息,它选择类内散布正交的矢量作为特征脸空间,从而压制了图像之间与识别信息无关的差异,强调了不同人脸之间的差别,同时弱化了同一人脸由于光照、视角和表情而引起的变化,获得了比特征脸更好的识别效果。LDA[22]是一种监督学习方法,而PCA是非监督学习方法。Belhumeur对16个人的各10幅图像进行识别实验,PCA方法的识别率为81%,而Fisher脸方法的识别率为99.4%。
Moghaddam[23]等人提出了贝叶斯人脸识别方法。他们提出了一种基于概率的图像相似度度量方法,将人脸图像之间的差异分为类间差异和类内差异。其中类间差异表示不同对象之间的本质差异。类内差异为同一对象的不同图像之间的差异。而实际人脸图像之间的差异为两者之和。如果类内差异大于类间差异,则认为两人脸图像属于同一对象的可能性大,他们提出了类间差异和类内差异度量的概率模型和计算方法。由于贝叶斯相似度的计算涉及复杂的非线性计算。Moghaddam等人提出了一种线性的快速计算方法。这种人脸识别方法在1996年美国DAPAR组织的FERET人脸测试中是效果最好的方法之一特别是在克服光照和表情变化对识别的影响方面性能较好。
奇异值分解[24](Singular Valor Decomposition。SVD)是一种有效的代数特征提取方一法。奇异值特征具有良好的稳定性、转置不变性、旋转不变性、位移不变性以及镜像变换不变性等重要性质。因此奇异值分解技术也被应用到人脸识别领域。
独立成分分析[25](Independent Component Anal-ysis,ICA),可以看成是对PCA的推广,PCA利用二阶矩去掉输人数据的相关性。使得数据的协方差为零。而ICA使得输人数据的二阶和高阶矩依赖性最小,ICA首先被用于盲源分离(Blind Source Separation。BSS)问题,用来将观察信号分解成一系列独立信号的线性组合。ICA用于人脸识别有两种结构(ICA Architecture I和ICA Architecture II)和多种算法(例如FastICA和InfoMax),PCA和ICA Architecture II利用的是全局特征,而ICA Architecture I利用的是空间局部特征。B Draper等人详细比较了PCA和ICA在人脸验证和面部表情识别中的性能,人脸验证实验中,ICA Architecture II的性能最好。PCA的性能与距离度量标准有关。ICA Architecture I的性能较差,ICA用Fast I-CA算法较好;表情识别实验中,用InIoMax算法实现的ICA A rchitecture I性能最好。
3、人脸识别面临的挑战
当光照、姿态、表情变化时,人脸的表象会产生较大变化,从而造成人脸识别系统的性能下降。FE-RET测试川表明,光照和姿态变化问题是当前人脸识别系统面临的挑战。随着人脸识别研究的深人,很多研究者对光照和姿态变化进行了专门的研究,也取得了一定的进展。本节专门针对这两方面问题进行论述。
3.1 光照变化
因为光照会改变人脸图像灰度的相对分布,所以由光照引起的人脸图像变化甚至比因个体差异引起的变化还要大。因此,光照变化会造成人脸识别系统性能的严重下降。对光照变化的处理已经引起了很多研究者的重视,并且取得了较大进展。目前已经出现了很多光照处理方法,这些方法大致可以分为三类: 第一类方法的主要思想是寻找对于光照变化不敏感的人脸图像表示方法。第二类方法是对原来某些不存在光照变化时人脸识别算法的简单改进和推广。第三类方法的主要出发点是构建图像合成(Synthesize)模型[26],这些模型可以合成与测试(Probe)图像具有相同或相似光照条件的新图像作为数据库(Gallery)中的图像。这类方法的关键是对光照进行建模。
3.2 姿态变化
视角的变化,即人脸姿态变化也会造成人脸识别系统性能的降低,因此对多视角人脸图像的处理是人脸识别面临的另一挑战。Beymer[27]先对输人图像的视角进行估计,接着根据自动检测到的三个特征点进行二维仿射变换使之与原型(Prototype)的视角相同,然后直接使用模板匹配来实现多视角人脸识别。在一个62人的多视角人脸数据库上取得了较好的实验结果,但测试集和训练集的视角比较接近,因此识别难度较低。
Pentland[28]等人提出的基于视角的特征脸(View-based Eigenface)方法为每个视角构建一个
特征空间。取得了比标准特征脸方法更高的性能。Huang等人在基于视角的特征脸方法的基础上,采用神经网络集成(Neural Network Ensemble)的方法,实现多视角人脸的识别。这类方法的缺点是每人需要多张人脸图像作为训练集,而且将光照变化问题与视角变化问题分开来考虑,这些前提条件在很多场合不能满足。
3.3同时存在光照和姿态变化
上述的很多方法只是对光照或姿态变化中的一种进行了处理,但在现实情况下,光照和姿态变化会同时存在。因此,要使人脸识别技术真正实用,人脸识别系统必须能够处理同时存在两种甚至任意多种成像条件变化的情况。光场(Light Field)[29]方法是最新提出的较有效的方法,对各种外部成像条件的变化都能进行较好处理。由于人脸是三维的,因此利用三维模型(或者三维和两维相结合)可以显著地提高识别性能。
4总结与展望
本文对人脸识别的发展历史、研究现状进行了综述,尤其是对近几年来在光照和姿态变化处理方面的研究进展进行了详细论述。
经过几十年的研究,人脸识别已经取得了很大的进展,但现有的人脸识别方法一般都是针对某一类问题提出的,由于人脸识别问题的复杂性,实现一个通用的人脸识别系统目前还不现实。因此,解决特定条件或者特定应用领域的人脸识别问题仍然是目前人脸识别研究的重要课题。要构建一个稳健的人脸识别系统,以下是有待于解决的几个主要问题:
1、非线性建模问题。目前统计方法中的子空间方法有一个共同的特点,即都是线性方法。人脸图像显然是一种高度非线性的模式。也就是说,人脸图像的分布应该是位于某种高度非线性的流形[30](Mani-fold)上的,因此用非线性方法来进行人脸识别是一个必然的发展趋势。人脸识别技术由线性向非线性发展可能的现实途径有两条:一是利用核理论将现有的线性分析方法向非线性扩展,这是一种间接的方法。典型代表是核主成分分析(Kernel Principal Component Analysis, KPCA),也就是利用核理论对PCA进行扩展;二是直接从数据分布本身出发,研究高效的非线性流形学习算法,从而将人脸图像投影到其实际分布所在的流形上进行识别,目前,已有研究人员将其应用到人脸识别领域,对人脸图像采用流型的方法来进行识别。
2、三维建模问题。目前只利用二维信息的人脸识别方法只能在特定环境下取得较好的性能,然而在处理光照、视角和表情等方面的变化时会遇到较大的困难。由于人脸是三维的,因此利用三维模型可以显著提高识别性能本文论述的三维可变型模型方法就是在这方面较好地尝试。但是目前三维人脸识别在识别算法、三维人脸库以及实验方法等方面还存在很多挑战。
3、三维模型计算开销问题。利用三维模型可以显著提高识别性能,然而,构造和存储完整的三维人脸模型需要的开销太大,因此如何通过二维图像对三维人脸参数进行建模将是未来人脸识别研究的一个热点。另外,利用2.5维信息进行识别也是减小存储和计算开销的一条可能途径。
4、算法的自动化与时间开销问题。本文所提到的算法中,基于几何特征的方法与基于模型的方法中的部分算法存在手工标定人脸特征点的问题,算法的自动化程度有待进一步加强。另外,算法中某些鲁棒性与准确率较高的算法,计算量巨大,运算时间比较长,人脸识别的实时性有待加强。[1] 厉小润,赵光宙,赵辽英.改进的核直接Fisher描述分析与人脸识别[J].浙江大学学报:工学版, 2008,42(4): 583-589.[2] YU Hua, YANG Jie.A direct LDA algorithm for high-dimensionaldatawith application to face recognition [J].Pattern Recognition,2001,34(10): 2067-2070.[3] 周大可,杨新,彭宁嵩.改进的线性判别分析算法及其在人脸识别中的应用[J].上海交通大学学报, 2005,39(4): 527-530.[4] BARTLELLM S, MOVELLAN JR, SEJNOWSKIT J.Face recognition by independent component analysis [J].IEEE Trans on NeuralNetworks, 2002,13(6): 1450-1464.[5] 洪子泉,杨静宇.基于奇异值特征和统计模型的人像识别算法[J].计算机研究与发展, 1994,31(3): 60-65.[6] 杜干,朱雯君.基于局部奇异值分解和模糊决策的人脸识别方法[J].中国图象图形学报, 2006,11(10): 1456-1459.[7] 高全学,梁彦,潘泉,等.SVD用于人脸识别存在的问题及解决方法[J].中国图象图形学报, 2006,11(12): 1784-1791.[8] COOTES T F, EDWARDS G J, TAYLOR C J.Active appearance models: active appearance models [ J].IEEE Trans on Pattern Analysis and Machine Intelligence, 2001,23(6): 681-685.[9] WISKOTTL, FELLOUS JM, KRUGER N,et al.Face recognition by elastic bunch graphmatching [J].IEEE Trans on Pattern Analysis and Machine Intelligence, 1997,19(7): 775-779.[10] WURTZ R P.Object recognition robust under translations, deformations, and changes in background [ J].IEEE Trans on Pattern Analysis and Machine Intelligence, 1997,19(7): 769-775.[11] 孙大瑞,吴乐南.基于特征的弹性图匹配人脸识别算法[J].应用科学学报, 2002,20(4): 377-381.[12] 张海旸,马华东.基于网格的自适应弹性图人脸匹配方法[J].计算机辅助设计与图形学报, 2008,20(2): 253-258.[13] 刘小军,王东峰,张丽飞,等.一种基于奇异值分解和隐马尔可夫模型的人脸识别方法[J].计算机学报, 2003,26(3): 340-344.[14] 李耀东,崔霞,肖柏华,等.自动人脸识别技术综述[J].计算机科学, 2002,29(12): 1-11.[15] 邹志煌,孙鑫,程武山.人脸识别技术产品的发展概况[J].视频应用与工程, 2008,32(3): 91-93.[16] 刘瑾,徐可欣,陈小红,等.采用图像融合技术的多模式人脸识别[J].工程图学学报, 2007,28(6): 72-78.[17] 王耀明,王仲国,沈毅俊.基于图像集似然度的人脸识别[J].计算机工程, 2001, 27(7): 113-114.[18] 王宏勇,廖海斌,段新华,丁汨.基于奇异值与特征融合矩阵的自适应人脸识别[J].计算机工程与应用,2010,46(7):162-174.[19] 斯华龄,张立明.智能视觉图像处理-多通道图像的无监督学习方法及其他方法[M].上海:上海科技教育出版社,2002.[20] 郭武,张鹏,王润生.独立分量分析及其在图像处理中的应用现状[J].计算机工程与应用,2008,44(23):172-176.[21] 白晓明,王成章,石勤.基于二维线性判别分析的彩色人脸识别[J].北京工业大学学报.2010,12(36):1717-1721.[22] 王晓慧.线性判别分析与主成分分析及其相关研究评述[J].中山大学研究生学刊(自然科学、医学版).2007,4(28):50-59.[23] 聂会星,梁坤,徐枞巍.基于小波变换和支持向量机的人脸识别研究[J].合肥工业大学学报(自然科学版).2022,2(34):208-211 [24] 段锦著.人脸自动机器识别[M].北京: 科学出版社, 2009.
[25] 吴巾一,周德龙.计算机应用研究[J].人脸识别方法综述,2009,9(26): 3205-3209 [26] SIROVITCH L, KIRBYM.Low-dimensionalprocedure for the characterization of human face[ J].Journal of the Optical Society of America, 1987,4(3): 519-524.[27] KIRBYM, SIROVITCH L.Application ofKarhunen-Loeve procedure for the characterization ofhuman faces[J].IEEE Trans on Pattern Analysis and Machine Intelligence, 1990,12(1): 103-108.[28] 刘成明,张立明.一种改进的人脸特征点定位方法[J].复旦学报:自然科学版,2006,45(4):452-463.[29] 杜春华.人脸特征点定位及识别的研究[D].上海:上海交通大学.2008.[30] 马艳妮,耿国华等.脸部特征点的定位与提取方法[J].计算机工程与应用,2009,45(18):167-170.读书的好处
1、行万里路,读万卷书。
2、书山有路勤为径,学海无涯苦作舟。
3、读书破万卷,下笔如有神。
4、我所学到的任何有价值的知识都是由自学中得来的。——达尔文
5、少壮不努力,老大徒悲伤。
6、黑发不知勤学早,白首方悔读书迟。——颜真卿
7、宝剑锋从磨砺出,梅花香自苦寒来。
8、读书要三到:心到、眼到、口到
9、玉不琢、不成器,人不学、不知义。
10、一日无书,百事荒废。——陈寿
11、书是人类进步的阶梯。
12、一日不读口生,一日不写手生。
13、我扑在书上,就像饥饿的人扑在面包上。——高尔基
14、书到用时方恨少、事非经过不知难。——陆游
15、读一本好书,就如同和一个高尚的人在交谈——歌德
16、读一切好书,就是和许多高尚的人谈话。——笛卡儿
17、学习永远不晚。——高尔基
18、少而好学,如日出之阳;壮而好学,如日中之光;志而好学,如炳烛之光。——刘向
19、学而不思则惘,思而不学则殆。——孔子
20、读书给人以快乐、给人以光彩、给人以才干。——培根
2.浅谈人脸识别 篇二
关键词:人脸识别,二维识别算法,三维识别算法
一、引言
1. 人脸识别概述。
人脸识别由于可接受性好, 在生物识别领域得到较快的发展。人脸识别的研究范围广义上来讲大致包括以下五个方面的内容:人脸定位和检测、人脸表征 (人脸特征抽取) 、人脸鉴别、表情/姿态分析、生理分类五方面内容。
2. 人脸识别现状。
目前有世界级的人脸检测算法测试项目, 它的结论完全可以揭示人脸识别现状。最早是1993年, 美国国防部高级研究项目署和美国陆军研究实验室FERET项目组, 建立了FERET人脸数据库, 用于评价人脸识别算法的性能。针对工业界的是在2002年, FRVT2O02对成熟的全自动人脸识别系统进行独立的技术评价, 提供评价人脸识别系统满足大规模、真实世界应用能力的性能度量。FRVT2006是第一次将静态人脸识别、虹膜识别与3 D人脸识别放在一起进行测试;与FRVT2002相比, 静态人脸识别与3D人脸识别算法结合的错误率下降了一个数量级;FRVT2006是第一次将机器识别效果与人的识别能力进行比较, 结果发现, 在不同的光照环境下, 给定一个低的虚警率, 七个自动人脸识别算法的性能相当于或优于人的识别能力, 若不指定虚警率, 则七个算法中的三个算法的性能相当于或优于人的识别能力。
二、二维人脸识别算法综述
目前的人脸识别方法主要集中在二维图像方面, 二维人脸识别主要利用分布在人脸上从低到高80个节点或标点, 通过测量眼睛、颧骨、下巴等之间的间距来进行身份认证。人脸识别算法主要有:
1. 基于模板匹配的方法:模板分为二维模板和三维模板, 核心思想:利用人的脸部特征规律建立一个立体可调的模型框架, 在定位出人的脸部位置后用模型框架定位和调整人的脸部特征部位, 解决人脸识别过程中的观察角度、遮挡和表情变化等因素影响。
2. 基于奇异值特征方法:人脸图像矩阵的奇异值特征反映了图像的本质属性, 可以利用它来进行分类识别。
3. 子空间分析法:因其具有描述性强、计算代价小、易实现及可分性好等特点, 被广泛地应用于人脸特征提取, 成为了当前人脸识别的主流方法之一。
4. 局部保持投影 (Locality Preserving Projections, LPP) 是一种新的子空间分析方法, 它是非线性方法Laplacian Eigen map的线性近似, 既解决了PCA等传统线性方法难以保持原始数据非线性流形的缺点, 又解决了非线性方法难以获得新样本点低维投影的缺点。
5. 主成分分析 (PCA)
PCA模式识别领域一种重要的方法, 现在已被广泛地应用于人脸识别算法中, 基于PCA人脸识别系统在应用中面临着一个重要障碍:增量学习问题。增量PCA算法由新增样本重构最为重要PCS, 但该方法随着样本的增加, 需要不断舍弃一些不重要PC, 以维持子空间维数不变, 因而该方法精度稍差。
6. 其他方法:弹性匹配方法、特征脸法 (基于KL变换) 、人工神经网络法、支持向量机法、基于积分图像特征法 (adaboost学习) 、基于概率模型法。
三、三维人脸识别算法综
二维人脸识别方法的最大不足是在面临姿态、光照条件不同、表情变化以及脸部化妆等方面较为脆弱, 识别的准确度受到很大限制, 而这些都是人脸在自然状态下会随时表现出来的。三维人脸识别可以极大的提高识别精度, 真正的三维人脸识别是利用深度图像进行研究, 自90年代初期开始, 已经有了一定的进展。三维人脸识别方法有:
1. 基于图像特征的方法:
采取了从3D结构中分离出姿态的算法。首先匹配人脸整体的尺寸轮廓和三维空间方向;然后, 在保持姿态固定的情况下, 去作脸部不同特征点 (这些特征点是人工的鉴别出来) 的局部匹配。
2. 基于模型可变参数的方法:
使用将通用人脸模型的3D变形和基于距离映射的矩阵迭代最小相结合, 去恢复头部姿态和3D人脸。随着模型形变的关联关系的改变不断更新姿态参数, 重复此过程直到最小化尺度达到要求。基于模型可变参数的方法与基于图像特征的方法的最大区别在于:后者在人脸姿态每变化一次后, 需要重新搜索特征点的坐标, 而前者只需调整3D变形模型的参数。
四、人脸识别算法发展趋势
二维与三维人脸识别相结合, 多种模式的识别使用, 可以有效地提高人脸识别精确度;二维识别算法逐步应用于三维人脸识别;人脸识别算法要能克服:姿势、表情的变化, 佩戴眼睛、珠宝和其它一些因素及光线等因素影响;识别算法应该需要更少的计算量。
参考文献
[1]段锦周春光刘小华:三维人脸识别研究进展[J].小型微型计算机系统, 2004, 25 (5) :886~890
[2]邢书宝:电子商务环境下生物特征识别技术综述[J]《.商场现代化》, 2008年第9期, P146
3.人脸识别 协助破案 篇三
由于视频监控正在快速普及,在众多的视频监控技术当中,
人脸识别技术可以从监控视频图像中实时查找人脸,并与人脸数据库进行实时比对,
让警方快速抓捕逃犯。
今年8月以来,中国保钓事件继续发酵,北京、深圳、广州、成都、长春、西安等地,相继发生规模较大的反日示威游行,爱国热情举世睹目。但是令人遗憾的是,也有一些不法分子打着“拒绝日货”的旗号或者是幌子肆意打砸路过的日系车辆,给很多居民造成了严重的财产损失。
最近一段时间,深圳、西安等一些城市警方公布了这些人进行日系汽车打砸的截屏图像或者是头像,在警方的压力下,一些犯罪嫌疑人走向了自首,但是也有一些人还没有被抓获。
有不少网友表示,警方可以使用人脸识别技术将这些故意打砸日系汽车的人抓捕归案。人脸识别技术真的有这么神奇?
记者体验,2~3秒身份被识别
?清华大学、中国科学院计算技术研究所和中国科学院自动化研究是我国人脸识别领域最具权威性的三个研究基地。“利用我们的处理器进行数据处理,比普通的计算机进行数据处理要快7952.6倍,在进行海量的数据分析和处理时,它就可以充分显现出自己的技术优势。” 清华大学电子工程系教授苏光大说。
9月26日上午,在苏光大教授的办公室,记者见到了多种人脸识别设备并体验了它的功能。
按照要求,记者掏出自己的二代身份证,站在办公室安装好的一架专用视频设备面前,让头像进入设备,然后将二代身份证在视频设备的扫描区域扫描,大约2~3秒钟后,视频头像和二代身份证所截取的头像出现在电脑屏幕上:左边是身份证上的照片,右边则是刚刚拍摄到的头像。屏幕上的数据分析显示,视频头像和二代身份证头像为同一个人。
利用脸部特征辨认身份
?“人脸识别包括了构建人脸识别系统的一系列相关技术,有人脸图像库的建立、人脸检测和定位、特征提取、身份确认以及身份查找等。”苏光大表示,该技术应用的过程并不神秘,最大的特点是利用人的脸部特征作为一种身份辨认的方式——即通过摄像机采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行一系列技术处理,判断输入的图像中是否存在人脸。虽然指纹同样具备了人类特有的身份信息,但不够直观,而灵活的人脸识别技术不需要身体接触,就可以在不同的场合中实现各式各样的智能化应用。
根据目前的研究,进行人脸识别对比的具体方法有多种,比如几何特征人脸识别方法,根据眼、鼻、嘴等的形状和它们之间的几何关系进行对比识别。此外,还有基于特征的人脸识别法、神经网络人脸识别法等。
在没有该项技术以前,古今中外,抓捕嫌疑犯或者罪犯一般都需要画像,然后张贴通缉,但这种大海捞针式的传统方式不仅耗费时间、工作量大,其准确率也很低。
现在,警方大多通过发布信息和照片通缉在逃嫌犯,或者核对可疑人员的身份证件信息以确认其身份。但这种方式需要警察记忆,并在大范围人群中,用肉眼去搜索与嫌犯长得相似的目标人。这常常让很多犯罪嫌疑人很难在短时间内予以抓获。
按照苏光大的说法,对很多打砸者而言,查清他们的信息并不是难事,只要将视频采集到的清晰头像和第二代身份证信息库中的头像进行对比,立马就可以判断出一些打砸者的真实身份。如果打砸者在视频中的头像较小,或者并非正面照,且模糊不清,则需要首先将视频头像予以放大,然后根据视频留下的一些人脸轮廓信息进行人像重构,在重构完成以后再和第二代身份证信息库中的头像进行对比,将其真实信息搜索到的几率就比较大。
因为计算机识别和人眼识别不同,人在大范围内识别比较困难,计算机则可以在千万人中不断识别,并且永远不知道疲劳。
需要大级别的人像数据库
?1989年,苏光大课题组就承担了公安部“GA计算机人像组合系统”研究项目。这套人像组合系统的基本要件就是利用计算机进行画像,只要在计算机中建立储存有各种眼睛、鼻子、嘴巴、眉毛、脸型等信息的信息库,在受害人凭记忆描述犯罪嫌疑人的各种相貌特征时,操作人员在信息库取来与之相应的眼睛、鼻子、嘴巴……直到组合成一个与犯罪嫌疑人特征相像的人像。
与传统手绘肖像相比,这种计算机画像能够变得更加便捷,也很容易进行画像的修改与微调,如果视频图像和目击者记忆结合起来,其画出来的人像也会更加真实。1994年,武汉市公安局利用该技术破获了一持枪抢劫特大案件,成为我国利用人像组合破获的首起成功案例。之后,该系统成为公安部门的必备装备。
近些年,通过计算机画像自动在目标人员数据库中搜索犯罪嫌疑人也成为公安机关在侦破案件时常常采用的手段。苏光大表示,前提就是要建立有大级别的人像数据库系统。
“在我国,绝大多数人都在使用第二代身份证,而根据第二代身份证上的人像就可以构建出庞大的人像数据库。”他说,根据公安部门提供的身份信息,2008年1月,他们建立了国内首套千万级数据库的人脸识别系统,这也是目前中国最大的人脸识别系统。在进行一些案件侦破时,通过电脑画像,而后通过系统和数据库系统的人像资料进行对比,就可以迅速查找犯罪嫌疑人的真实身份。最初该系统建立了9.2万人的数据库,用四台微机并行处理,比对一次仅耗时58秒。
如数据完善,周克华案可能早就告破
?近些年来,视频监控得到了迅速发展,但在视频监控场景中,监测到的人脸图像往往很小,目前,最新的技术可以将人像重建技术与人像识别综合系统结合在一起,从而获得相对清晰的人像。
系列持枪抢劫杀人案制造者、公安部A级通缉犯周克华就是一个典型的例子。苏光大说,重庆恶性案件发生几天以后,他就受到重庆警方的邀请去进行电脑画像。根据重庆警方提供的视频信息,他和警方在上面找到了一个形迹最为可疑的犯罪嫌疑人,但是由于视频图像太小,看不清该人的面部信息,随后通过技术手段,苏光大将放大的犯罪嫌疑人的头部视频进行了电脑复原画像,并在2009年的4月1日就提供给了重庆警方,但是遗憾的是在随后和第二代身份证的信息对比中,并没有找出该犯罪嫌疑人。
nlc202309010615
“现在案件破了才知道,周克华根本就没有使用第二代身份证,因此搜不到他的信息。”苏光大说,但是当时如果重庆警方能够提供云南的重点人员信息库,2009年就可以抓住周克华。原来周克华曾经在2005年因贩卖枪支被云南铁路法院判刑并在当地服刑3年,他在服刑期间被采集的有档案样照,后来公安部通缉令的上半部分照片便是他的这一档案样照。苏光在你身边“潜伏”的那些眼睛大说,2009年搜索的信息库中如果有这一档案样照,周克华就很难逃脱。
“不久以前我利用周克华的电脑复原像和在一个包含他的档案样照的36万人的重点信息库中搜索,周克华在搜索中排到了第3的位置,而其相似度则高达71.53%。”他说。
在你身边“潜伏”的那些眼睛
在美国大片《越狱》中和科幻电影《终结者》中,都曾出现过这样的场景:一个人走到保险库大门前,由摄像头对他的脸进行扫描——他的脸部特征就是进入保险库的密码——如果符合,大门自动开启,如果不符,则警铃大作。这种过去在好莱坞间谍大片里才能见到的场景,目前在现实生活中亦成现实。如今在国内,已经有多种型号的人脸识别系统出现,除了保险库等一些重要区域,在门禁系统中也得到了广泛的推广应用。
观看比赛 ,快速比对观众身份
2008年,人脸识别系统就在北京奥运会上成功应用。这也是奥运史上首次采用具有“生物特征”的身份识别技术。在开幕式和闭幕式当晚,观众进入“鸟巢”,除了要被检查门票外,还必须逐一在进场通道前“拍照”。持票人刷票时,摄像头在一两秒钟内抓拍人脸,定位面部关键点,并提取特征,随后将持票人和票内信息的认证结果同时上传到计算机,计算机存有观众事先提交的包含正面免冠照片的身份信息,如果上传的持票人照片特征与计算机数据库中已储存的购票人特征重合度达到设定的阈值时,便能获得认证并通过。整个过程只需要两三秒时间。在而后的残奥会开幕式、闭幕式上,该系统也得到了有效的利用。
中国科学院自动化研究所博士张小博表示,在非控制状态下,虽然人脸识别技术的准确率目前还无法达到100%,但由于拥有识别速度快、不易被察觉等其它技术无法比拟的优越性,近些年得到日益广泛的应用,已经从原有的刑侦、安检等领域,进入物业管理、公司考勤等人们的日常工作和生活中。
手机只认主人的脸
记者在汉王科技公司看到,“人脸通”门禁系统已经实现了活体生物特征检测,可以进行非接触、自动人脸识别等功能。汉王科技的技术人员告诉记者,他们研发的这种人脸识别系统具有存储功能,只要把一些具有潜在危险性的“重点人物”脸部特征输入存储系统,识别系统发现后就会自动发出警报,向其安保中心“报警”。
现在在网站上,已经有能够应用到手机上的人脸识别软件下载,只要将该软件下载到手机上,开启后将手机屏幕对准自己的脸,手机上的摄像头打开识别自己的面目,信息核对准确后屏幕后就会自动打开,以后也只有是自己的脸出现,手机才能正常工作,反之,屏幕就会显示,“很抱歉,我不认识您!”。
人脸识别系统应用于高铁
今年4月13日,京沪高铁安检区域人脸识别系统工程开始招标,上海虹桥站、天津西站和济南西站三个车站安检区域将安装用于身份识别的高科技安检系统——人脸识别系统,以协助相关部门辨认乘客身份。
张小博表示,人脸识别经过40年左右的发展,现在的技术已经趋于成熟。尤其是美国9·11事件发生后,人脸识别技术备受关注。如今国际上最好的识别率现已达到99%以上,在短短1秒钟的时间里就可以识别出来。
北京师范大学信息科学与技术学院院长周明全对记者表示,人脸识别技术甚至为一些无名尸骨的识别提供了有效手段,从而帮助破获一些被害人已经死亡多年的复杂案件。加上专门开发的修饰软件,40分钟左右就可以使一具头骨复原面貌,从而为确定死者、警方破案提供最关键线索。而人脸识别在这个过程中扮演着至关重要的角色。
未来的人脸识别技术
特工哈纳韦戴上隐形眼镜,拿着手机,在火车站茫茫人海中寻找跟踪对象。而他戴的眼镜就像个录入摄像头,将看到的信息进行自动收集,通过无线传输与手机或者电脑相连,利用人脸识别功能,迅速与人物信息库中的人脸特征进行比对、匹配,从而在一眨眼的工夫,就迅速精准地锁定了一位男士。今年初,在国内热映的《碟中谍4》中的经典镜头,向观众生动地展示着人脸识别科技的魅力。
人脸识别实时跟踪成为可能
苏光大告诉记者,《碟中谍4》中的人脸识别科技并不是来自于虚幻,目前,利用人脸识别技术在茫茫人海中搜索目标对象并对其进行跟踪已经逐步变成了现实。如今,国内研发的系统已经可以进行“无线”人脸识别,即应用手机拍摄人脸图像,通过无线传输,发送到识别系统进行人脸识别,并把识别结果发回手机。
如今,美国维萨格公司的脸像识别技术在美国的两家机场大显神通,它能在拥挤的人群中挑出某一张面孔,判断他是不是通缉犯。而国内的一些公司已在开发人脸识别或物体识别技术,其产品可将识别抽取出的数据作为搜索请求并交由搜索引擎处理,从而锁定目标人物。
中国移动通信研究院主任研究员邓小宁指出,依托云计算的搜索引擎,人脸识别智能终端产品的功能已经比较强大,现在已完全有能力快速、准确地从图像中提取人脸信息,实现人物信息数据库比对。
身份造假将难上加难
未来随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多的领域。 比如人脸识别门禁考勤系统,人脸识别防盗门等。而利用人脸识别辅助信用卡网络支付,就可以防止非信用卡的拥有者刷卡。
苏光大表示,现在比较先进的考勤系统、防盗门的人脸识别系统都需要对识别物的温度进行判断,或者进行人体活性的一些判断,这样照片、面具和打印人像就很难蒙混过关,另外一些系统还设置了只识别活体生物的程序,其在信用卡上的应用也可以如此进行设置。
而对电子护照及身份证进行身份识别,这或许是未来规模最大的应用。在国际民航组织已确定,从 2010年 4月 1日起,其 118个成员国家和地区,必须使用机读护照,人脸识别技术是首推识别模式,该规定已经成为国际标准。
4.人脸识别考勤管理规定 篇四
一、时间安排
1、有效识别时间:上班:6:00-8:30
下班:17:30-19:00
农电工:上班:6:00-8:30
下班不需要签到
2、迟到:考勤机自动处理数据,晚于上班有效识别时间签到视为迟到。
3、早退:考勤机自动处理数据,早于下班有效识别时间签到视为早退。
4、旷工:迟到、早退、未签到,计算工时累计高于1小时,为旷工半天。 迟到、早退、未签到,计算工时累计高于3小时,为旷工全天。
二、相关规定
1、考勤次数安排:
北院:各部室人员每天早晚各考勤一次;汽车队、物业公司每天早上考勤一次;值班员按原考勤方式考勤,不用录入考勤机。
南院:中心管理人员每天早晚各考勤一次;其他人员及生产班组一线人员每天早晨考勤一次;餐饮中心人员按原考勤方式考勤,不用录入考勤机。
客户中心大楼:营销咳嗽鼻疤ㄈ嗽泵刻煸缤砀骺记谝淮;城区抄表班人员每天早晨考勤一次。人员每天按时倒班,按原考勤方式考勤,不用录入考勤机。餐饮中心人员按原考勤方式考勤,不用录入考勤机。
2、只有在“有效识别时间”段内签到者为有效考勤,其他时间段签到无效。
3、对于外出工作而不能正常时间签到者,应将经单位负责人签字并说明原因的材料报至人力资源部备案。
4、有事提前请假,请假人员须提前一天将请假条送人力资源部,特殊情况,按公司《职工考勤管理办法》补办请假手续送人力资源部。
5、如因特殊情况需要调整考勤时间的单位,可由单位提出申请,经主管领导批准,报人资部备案。
三、使用注意事项
1、请在较黑暗处使用考勤机,不要进入过多阳光。
5.浅谈人脸识别 篇五
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机采集人脸图像,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术处理,包括人脸图像采集、人脸定位、人脸识别预处理、记忆存储和比对辨识,达到识别不同人身份的目的。
市场现状
人脸识别技术的研究始于20世纪60年代末期。20世纪90年代后期以来,一些商业性的人脸识别系统逐渐进入市场,但是,这些技术和系统离实用化都有一定距离,性能和准确率也有待提高。
美国遭遇恐怖袭击后,这一技术引起了广泛关注。作为非常容易隐蔽使用的识别技术,人脸识别逐渐成为国际反恐和安全防范重要的手段之一。近年来,人脸识别在中国市场,也经历着迅速的发展,而且发展的脚步也越来越快。主要原因有以下两方面。科技的进步
国际上,美国标准与技术研究院(NIST)举办的Face Recognition Vendor Test 2006,通过大规模的人脸数据测试表明,当今世界上人脸识别方法的识别精度比2002年的FRVT2002至少提高了一个数量级(10倍),而对于高清晰,高质量人脸图像识别,机器的识别精度几乎达到100%。在我国,近年来科技界和社会各个方面都认识到人脸识别技术的重要性,国家政策对人脸识别技术研究给予了很大支持,使得我国人脸识别技术也得到了迅速的发展。应用需求的增加
越来越趋向于高科技的犯罪手段使得人们对各种场合的安全机制要求也近乎苛刻,各种应用需求不断涌现。人脸识别市场的快速发展一方面归功于生物识别需求的多元化,另一方面则是由于人脸识别技术的进步。从需求上来说,除了传统的考勤、门禁等应用外,视频监控环境下的身份识别正成为一种迫切的需求,即在一个较复杂的场景中,在较远的距离就识别出特定的人,这显然是其它生物识别方法所欠缺的,而人脸识别却是一个极佳的选择。技术历程
国家“十一五”科技发展规划将人脸识别技术的研究与发展列入其中,明确指出:“要在生物特征识别技术领域缩小与世界先进水平的差距,开展生物特征识别应用技术研究,开发具有高安全性、低误报率的出入口控制新产品。”在这种环境下,国内一些科研院所和院校在人脸识别技术方面取得了很大进展。如中科院自动化所,清华大学,中科院计算所自主开发的人脸识别技术已经达到了国际先进的水平。
传统的人脸识别技术主要是基于可见光图像的人脸识别,这也是人们最熟悉的识别方式,已有30多年的研发历史。但这种方式有着难以克服的缺陷,尤其在环境光照发生变化时,识别效果会急剧下降,无法满足实际系统的需要。解决光照问题的方案有三维图像人脸识别,和热成像人脸识别。但目前这两种技术还远不成熟,识别效果不尽人意。
最近迅速发展起来的一种解决方案是基于主动近红外图像的多光源人脸识别技术。它可以克服光线变化的影响,已经取得了卓越的识别性能,在精度、稳定性和速度方面的整体系统性能超过三维图像人脸识别。这项技术在近两三年发展迅速,使人脸识别技术逐渐走向实用化。[nextpage] 可见光人脸识别技术
可见光是光谱中人眼可以感知的部分,可见光谱没有精确的范围,一般人的眼睛可以感知可见光的波长在400到700纳米之间。作为可为人眼感知的光源,也是生活中最常见的光源。因此,传统的人脸识别技术主要基于可见光图像的人脸识别,这也是人们最熟悉的人脸识别方式。
为了克服受环境光照的影响,学术界做了大量的研究和技术开发。对可见光人脸识别系统进行了大量改进,以减轻环境光照的影响,目前也取得了一定的进步。
多光源人脸识别技术
在自然界中,除人眼可见的光线外,还存在着红外、紫外等不可见的光线。为了克服可见光因环境因素而变化的影响,相关企业做了大量的研究和技术开发。基于红外与可见光融合的多光源人脸识别方法是人脸识别技术的一项革命性创新,目的在于消除可见光变化对人脸识别的影响。
可见光图像受光源影响较大,而单纯的红外图像可以独立光源,但对温度变化比较敏感,而红外与可见光融合的多光源人脸识别方法,被证明比任意单一光源的识别更有效。它是一种基于融合红外与可见光图像的人脸识别方法,对红外与可见光人脸图像分别采用PCA与线性辨别分析相结合的方法进行特征提取和识别,并利用获得的识别结果与它们各自的置信度进行决策融合,并确定最终的人脸识别结果。实验表明,可以有效提高人脸识别性能和对各种应用环境的适用性。技术优势
人脸识别较之于其它生物识别技术,在社会公共安全领域的应用,具有更明显的优势。
首先是其自然性,该识别技术同人类(甚至其它生物)进行个体识别时所利用的生物特征相同。例如脸部识别,人类也是通过观察比较人脸区分并确认身份的,另外具有自然性的识别还有语音识别、体形识别等,而指纹识别、虹膜识别等都不具有自然性,因为人类或者其它生物并不通过此类生物特征区别个体。
其次是其不被察觉性,不被察觉对于一种识别方法也很重要,这会使该识别方法不令人反感,并且因为不容易引起人的注意而不容易被欺骗。人脸识别具有这方面的特点,它完全利用可见光获取人脸图像信息,而不同于指纹识别或者虹膜识别,需要利用电子压力传感器采集指纹,或者近距离采集虹膜图像,这些特殊的采集方式很容易被人察觉,从而更有可能被伪装欺骗。这一特点特别适用于逃犯跟踪系统。
再则是其非接触性和唯一性,使其更加适合运用于公安刑侦系统,门禁考勤系统,网络应用系统等。应用前景
目前生物识别技术已广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域。例如,一位储户走进了银行,他既没带银行卡,也没有回忆密码就径直提款,当他在提款机上提款时,一台摄像机对该用户的眼睛扫描,然后迅速而准确地完成了用户身份鉴定,办理完业务。这是美国德克萨斯州联合银行的一个营业部中发生的一个真实的镜头。而该营业部所使用的正是现代生物识别技术中的“虹膜识别系统”。此外,美国“9.11”事件后,反恐怖活动已成为各国政府的共识,加强机场的安全防务十分重要。美国维萨格公司的脸像识别技术在美国的两家机场大显神通,它能在拥挤的人群中挑出某一张面孔,判断他是不是通缉犯。
随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多的领域。
1、企业、住宅安全和管理。如人脸识别门禁考勤系统,人脸识别防盗门等。
2、电子护照及身份证。这或许是未来规模最大的应用,国际民航组织(ICAO)已确定,从2010年起,其118个成员国家和地区,必须使用机读护照,人脸识别技术是首推识别模式,该规定已经成为国际标准。中国的电子护照计划公安部一所正在加紧规划和实施。
3、公安、司法和刑侦。如利用人脸识别系统和网络,在全国范围内搜捕逃犯。
4、自助服务。如银行的自动提款机,如果用户卡片和密码被盗,就会被他人冒取现金。如果同时应用人脸识别就会避免这种情况的发生。
5、信息安全。如计算机登录、电子政务和电子商务。在电子商务中交易全部在网上完成,电子政务中的很多审批流程也都搬到了网上。而当前,交易或者审批的授权都是靠密码来实现,如果密码被盗,就无法保证安全。但是使用生物特征,就可以做到当事人在网上的数字身份和真实身份统一,从而大大增加电子商务和电子政务系统的可靠性。人脸识别产业的发展
这些年来我国经济发展日新月异,政府各部门对利用新技术解决关键问题热情支持。人脸识别技术广泛应用到电子护照、生物特征身份证、银行系统、公安系统、电子商务、电子政务等系统中,不但可以提高社会运行的效率,也可以大大增强公民日常生活的安全性。这将是一件功在当代利在千秋的好事。发展人脸识别技术离不开标准化工作。目前人脸识别标准化工作在公安部一所、电子技术标准研究所和中科院自动化所的倡导下,正在积极进行。这个工作不仅为规范国内技术产品提供标准化规范,也将为中国技术进入国际提供平台。
目前,人脸识别技术的应用还没有做到“普及”,但是不可否认,它已经在开始影响我们的生活。通过一批专家学者不倦的努力,我国的人脸识别技术已经不落后于发达国家。与此同时,市场对可靠的人脸识别技术的需求也越来越迫切。一旦人脸识别得以推广,发展前景将不可**。届时,人脸识别技术本身的发展和应用效果还将有更大的提升,那将为我们的生活带来更多的便利和安全。人脸识别产品选购安装需注意的事项
由于生物识别产品受到外界因素的影响比较大,因而在选购、安装等事项上也需要注意很多问题,而人脸识别产品受环境影响更大则更应该做较多的考虑。
那么在具体的选购安装中要注意的事项有:第一,该人脸识别产品在逆光下的检测结果是否理想。第二,注意该产品数据库的模板建立是否达到要求。理想情况下数据库的模板数量是越多越好,当然在选择的时候只要能达到自己的容量大小就可以了;另外,对最小像素点的要求也需考虑,如双眼要达到100个像素点则比较不错。第三,对产品采集图像的最小角度的要求能否达到自己的预期。若不能达到自己满意的角度则可以不考虑。
除此之外,眼镜对于识别率的影响也应该列入选购范围内,如采集图片的时候双目会不会被眼镜遮挡,若被采集者佩戴较粗的镜框,则有影响识别误差的可能性。还有一个比较重要的因素是,该产品是否具有活体检测功能,对于眼睛的睁开和关闭、眼球的运动等是否会影响到产品的识别误差。
安装的时候需要双向的结合考虑,安装摄像机不能太高,还要考虑软件能适应多少容量,补光情况怎样,对光线下的识别率影响情况如何,是否受偏光的影响较大等,都是需要安装的时候去认真考虑的问题。
以上这些都是检测人脸识别产品好坏的一些标准,希望能给工程商和用户提供一些选购安装的依据。
读书的好处
1、行万里路,读万卷书。
2、书山有路勤为径,学海无涯苦作舟。
3、读书破万卷,下笔如有神。
4、我所学到的任何有价值的知识都是由自学中得来的。——达尔文
5、少壮不努力,老大徒悲伤。
6、黑发不知勤学早,白首方悔读书迟。——颜真卿
7、宝剑锋从磨砺出,梅花香自苦寒来。
8、读书要三到:心到、眼到、口到
9、玉不琢、不成器,人不学、不知义。
10、一日无书,百事荒废。——陈寿
11、书是人类进步的阶梯。
12、一日不读口生,一日不写手生。
13、我扑在书上,就像饥饿的人扑在面包上。——高尔基
14、书到用时方恨少、事非经过不知难。——陆游
15、读一本好书,就如同和一个高尚的人在交谈——歌德
16、读一切好书,就是和许多高尚的人谈话。——笛卡儿
17、学习永远不晚。——高尔基
18、少而好学,如日出之阳;壮而好学,如日中之光;志而好学,如炳烛之光。——刘向
19、学而不思则惘,思而不学则殆。——孔子
6.浅谈人脸识别 篇六
人脸识别布控系统方案
北京众智益华科技有限公司
北京市海淀区清河三街同源大厦12层0926室
电话:010-62919824
网址:http://
一、项目背景及系统介绍
火车作为人们主要的出行工具,通过火车逃串的逃犯也较多。火车站作为人们乘坐火车的唯一进出口,在进出站行人中藏匿着各类特殊人群。当有需要对这些人员进行辨别、防范时,如何准确、有效地发现他们就成为车站公安,安保部门迫切希望解决的问题。
根据目前国内多数火车站进出站管理流程的模式来看,火车站的进站口、出站口、售票口都是旅客必经之地,在这类地区旅客的流动速度会放慢,就为拍摄照片及人脸比对提供了有利的条件。通常相关部门会在进出站口和售票处安装录像监控设备,利用这些地点的特殊性,通过人工进行辨认方式进行比对;或者直接排人员进行现场身份证抽查辨认。但人工查找和比对有很大的局限性,例如:面对大量的客流量导致的人工成本问题,人的记忆力有限,通常不能清楚地记住短时间接触的对象的面部特征;不能同时辨认多个对象;不能长时间保持注意力和辨认力等等。因此在这些主要地方迫切需要引入人脸智能识别比对系统,来提高安全防范的效率和效果。
北京众智益华综合智能视频联网监控管理平台(Integrated Intelligent Video Surveillance Network Management Platform,简称IVS)是分布式、智能化、网络化的视频智能识别分析、图像监控和集中信息管理平台。IVS利用现有的各种形式的数字网络,对监控前端经数字化压缩的视频信号,通过标准的TCP/IP联网协议,传输到监控中心进行智能化人脸检测分析识别比对,并结合分析结果与报警预案进行联动,从而达到智能化布控防范的作用。因此,IVS是集成了人工视觉/生物识别技术、计算机系统、软件、网络、通信、控制以及安全防范技术的综合技术平台。
本文将详细叙述通过北京众智益华科技有限公司的综合智能视频联网监控管理平台对28个车站,38个安检通道实现人脸识别布控的实现方案。
二、组网结构及系统构成
2.1 组网结构
(图一)
由“图一”可见我们采用了网络比对的方式把28个车站通过内部星形2M的网络进行连接,设置一个中心控制室,在中心控制室设置比对服务器,数据服务器,流媒体服务器等设备把火车站传来的视频进行分析比对,并把分析比对结果分别传送给中心客户端及火车站本地客户端,由客户端执行预警方案(比如声音报警,发生手机短信等)。
2.2 硬件产品构成
由“图一”可以看出,我们在拥有四个通道或三个通道的火车站采用模拟高清摄像机+四路CIF视频服务器的方式进行的原始视频采集,在两个或者只有一个通道的火车站采用标清的IP摄像机进行采集原始视频。
在中心我们设置数据服务器一台,比对服务器两台(比对服务器的台数来自于需要比对的图片个数及整个比对系统的速度,两台服务器能支持1秒2万张图片的比对),一台流媒体及存储服务器,大屏显示客户端,N个客户端。
28个火车站,38个通道具体设备列表如下: 模拟高清摄像机:7个 四路视频服务器:2个 标清IP摄像机:31个 服务器:4台
客户端机器:根据实际使用客户端的数量决定 2.3 软件产品构成
(1)综合智能视频联网监控管理平台一套,其中包括:数据服务器软件,流媒体/存储服务器软件,智能分析服务器软件,客户端(带电子地图)管理系统,大屏电视墙系统,人脸图库管理系统五部分组成。
(2)SQL SERVER数据库一套。
三、系统各模块详细说明
数据服务器
数据服务器需要连续工作,建议采用高稳定服务器,要求较高的场合建议采用双硬件冗余;WINDOWS2000以上操作系统,SQL数据库。(一)功能
设备的登录注册。设备冷启动、热启动或注销后,用设备唯一的ID号登录,合法设备(在配置管理服务器中配置)注册成功后,获取设备的硬件配置和工作参数,进入正常工作状态,非法用户拒绝登录。
用户的登录注册。用户采用用户名、密码和唯一的软件ID号登录,合法用户(在配置管理服务器中配置)注册成功后,获取用户可管理的前端对象,及操作权限,用户的级别。
认证服务器在收到用户布防请求后,进行权限判别,若请求合法,命令设备执行,否则拒绝,并给出相应的提示信息。(二)特点
集中权限管理。任何用户的权限改变能够即时反映到任何一个用户对任何系统的操作。
身份认证采用双因子认证,即口令与ID认证。
网络信息采用了SSL认证体系,保证了网络信令的安全。
用户的帐号支持一次性认证,即用户在访问不同子系统时,无需反复进行帐号认证。所有认证操作(包括成功的和失败的)都被日志系统记录并安全地保留,以备查阅。
用户的角色具有流动性。即用户操作的设备,权限只与用户名和密码有关,与具体的设备无关。
流媒体服务器/集中存储服务器
北京众智益华科技有限公司研制的流媒体/集中存储服务器,用于大型监控联网的企业级创新型的解决案,系统的硬件采用高端的服务器,兼备高端功能与可承受价格的先进存储系统,是经过验证的先进体系架构,连续的数据可用性和完整性,高级信息复制功能,功能强大的管理工具。从高、中、低端产品共享通用架构,可实现跨产品型号的平滑升级。(一)功能
流媒体转发。当网络中有多个用户访问同一个视频流时,虽然访问的是同一个视频流,但各自占用一个带宽资源,容易造成网络拥挤,影响视频的接收效果。众智益华在有质量(Qos)的多媒体网络传输上拥有独创性的核心技术,采用高效率UDP传输协议,自动穿透各种网络设备,根据网络结构自动启用单播技术,组播技术,也可强制制定,自适应网络流量控制,配合独创的编码,解码算法,在丢包率低于20%的情况下,仍然保证清晰流畅的视频效果,网络延时短,成功地解决了带宽资源和网络拥挤问题。设置流媒体转发服务器的目的在于缓解网络带宽紧张的区域,对该区域内的视频访问全部通过流媒体转发服务器软件模块来进行转发,使得该视频服务器的视频服务只占一个通道。流媒体网关。主要是实现异构设备和嵌入式设备接入,把不同设备的信令转化为统一的信令;把不同编码格式的流媒体数据转化为统一的流媒体格式;把不同的硬件控制协议转化为统一的控制协议从而实现异构设备的互连互通。
流媒体路由。支持双网卡或多网卡,实现跨网段联网监控系统。与不同的网络路由器相比,北京众智益华的流媒体路由设备,转发的效率高,在丢包率低于20%的情况下,视频仍然比较流畅,采用保护的语音数据延迟小,无噪声。
1.支持定时录像,报警联动实时录像。
2.支持前端分布式录像和后端集中录像的综合性方法。3.支持多路径数据存取,支持动态负载均衡与故障切换。4.存储服务器可选择DAS、NAS或SAN结构。
(二)特点
效率高。在普通P4,1G内存,双1000M网卡配置下,对1M的单路码流,单播转发300路的情况下,CPU占用的比例约为20%以下,音视频清晰流畅。网络功能强大。能根据交换机的性能,网络结构,服务的质量,自动启动单播或组播转发,无需人工干预,也可指定单播或组播。
支持异构设备多。众智益华的流媒体服务器支持主流板卡(海康、汉邦、恒亿、金鹏)的PC系列监控设备的接入;支持主流嵌入式(海康、大华、大立)监控设备的接入。
能实时根据不同的网络情况,自适应地选择合适的传输协议(TCP、UDP单播、UDP组播),调节视频包大小来优化网络传输,适应不同的网络环境。特有的NDU升级方式,无须数据迁移即可对存储系统进行硬件、软件升级,达到最安全的投资保护。
可从最小配置起始,因需而动,支持从5个硬盘驱动器到240个硬盘驱动器的灵活扩展,可伴随业务和需求的增长而进行扩容或升级。
系统高的可靠性,稳定性。屏蔽单点故障的高可用设计,为关键应用提供可信赖的系统和信息可用性;独立的双存储控制器,具有镜像式缓存;多种级别的RAID数据保护;自动系统诊断和全局热备盘技术(Hot-spare)。
高性能的检索信息保存和获取,采用专用的内嵌数据库,特别适合对录像资料进行检索。高可用性和容错系统提供三个层次上的容错,首先系统体系结构上的容错技术,系统支持分布式的集群技术,每台服务器正常执行当前的存储任务,但是同时又作为其他服务器的后备集群节点。第二个层次上的容错是在整个中心集群都和图像源断开,不能进行实时录像,系统通过计划和实际的录像执行情况进行补录。第三个层次的容错是在录像分包时,每一个录像文件结束和一个新的录像文件开始,系统都被冗余一部分数据,以保证没有任何图像帧丢失。
录像计划和补录根据预定计划和实际的执行情况的差异性,可以计算出需要补录得时间段,自动从合时的DVR下载缺少的录像信息。
清盘策略和录像优先保留权当系统发现存储的容量超过系统规定的最高警戒线,将开始启动清盘任务,这个工作是由挂接的认证中心服务器来管理的,认证中心服务器将定时检查磁盘的情况,进行磁盘的清理、自动导出等功能。系统提供集中清盘策略,包括先进先出、最近访问、最多访问、以及保留优先权。
对比服务器
(一)功能
通过流媒体视频进行视频分析
提取图像特征值与数据库中的预存进行比对 将设定阀值以上的结果发送给需要的各个客户端 将比对结果存入数据服务中心(二)特点
比对速度快,一台服务器支持百路视频小于等于1秒 采用国际先进人脸比对算法,比对结果准确。独有的人像搜索、跟踪、定位、捕捉技术,人脸抓拍率在98%以上,角度能达到35度的偏移不会影响抓拍效果。针对有多个人像张的照片,系统会自动检测人像并分割出多张独立的照片,识别准确度高识别准确度高,1:1识别准确率97%;1:N识别准确率95%以上。独有的图像三维建模技术,每张人脸图像预处理后的特征值大小只有2K左右,识别速度能达每秒2万张以上。
采用独有的组播技术,在节约最少带宽情况下,把比对结果发送给各个客户端模块。
强大的日志功能,通过与数据服务器的配置,将比对结果完整的保存到数据库方便日后查看。
具有很好的容错功能,保证服务出错后,3秒内自动恢复运行。采用C/C++开发,核心层稳定可靠。
网络分控
(一)功能
树形视频选择,声音监听与视频图像同步。连接视频后可进行图像抓拍操作。支持单分屏、四分屏、六分屏、七分屏、九分屏、十分屏、十三分屏、十六分屏、二十五分屏显示。
支持视频轮巡,分组轮巡等多种视频观看方式 可实现电子地图与视频联动
报警自动地图定位,具有缩略图功能
可回放前端设备录像分为硬盘录像机本地存储、流媒体/集中存储服务器录像。支持报警提示, 系统中一旦有报警产生,界面上有明显提示。支持报警联动, 报警后可联动地图,联动报警声音,联动视频录像,联动视频显示,联动分组及轮巡,联动手机短信,可以联动外围IO设备。可查看历史报警记录并进行人工确认赛选。具有用户注销锁定功能,安全方便。
电视墙中心管理系统
(一)功能
可选择任意一路主要视频的实时视频,并形象显示人脸截图 实时显示比对结果。(二)特点
支持1280×720高分辨率 实时显示最近四对报警结果 支持比对声音提示
四、技术特点
本系统具有很好的开放性,可以很容易兼容现有设备,并能很好的和其他平台形成互动。
本系统人脸识别速度快,准确率高,一台对比服务器可以完成100路的视频实时识别,并完成与数据库内图片特征值的实时比对。本系统人脸比对采用独有的人像搜索、跟踪、定位、捕捉技术,比对技术,人脸抓拍率在98%以上,角度能达到35度的偏移不会影响抓拍效果。针对有多个人像张的照片,系统会自动检测人像并分割出多张独立的照片;识别准确度高,1:1识别准确率97%;1:N识别准确率95%以上。独有的图像三维空间建模技术,每张人脸图像预处理后的特征值大小只有2K左右,识别速度能达每秒万张以上。
本系统具有很友好的界面操作,一旦发生报警,用户可以根据电子地图得到位置,可以看到实时视频,并能看到报警时比对服务器抓拍的照片以及图库中原照片,方便用户进行再次的确认。
7.浅谈人脸识别 篇七
本文先是提出了一种预处理[2]链技术, 通过不同光照预处理算法的融合能够很好地去除光照影响;然后借助于BDPCA (双向PCA) +LDA[3,4,5,6], 提出了一种基于Gabor变换[7]和NN-SVM分类器[8]的子空间人脸识别算法, 通过Gabor滤波得到每个人脸图像的40张特征纹理图, 经BDPCA+LDA的降维处理后提取到一系列特征向量, 再由NN-SVM分类器进行分类, 最终完成人脸识别。
1 预处理链技术
1.1 方法原理
由于光照、拍摄角度等方面的影响, 常常会造成拍摄图片照明不均匀, 甚至有些图片会出现大面积的阴影或人脸区域全黑的现象, 以至于脸部重要特征部分或全部被掩盖。为了清晰地还原真实的图像信息, 需要对图片进行预处理, 消除照明影响。所提出的预处理链技术融合了多种图像处理方法, 如伽马校正、高斯差分、掩膜和对比均衡化, 结合了算法各自的优点, 弥补了单独算法的缺点, 达到了更好的预处理效果。图1所示的是本文所提出的预处理链的算法流程。
Gamma校正[9]是对图像的伽马曲线进行色调编辑, Gamma校正函数可表示为:g (x) =255 (x/255) 1/γ。调整γ值就可以很方便地对图片进行灰度校正以达到自己的要求。在本文实验调试中, γ取值为1.5时处理效果最佳。由于在实际光照条件下, 图像中总存在介于高光和阴影区域之间的过渡区域, 过渡区域所掩埋的信息往往表现了图像的真实内容。仅仅使用Gamma校正进行处理, 虽然能有效地去除图像中的阴影部分恢复被掩盖信息, 但是与此同时丢失原本清晰的部分脸部特征。此时, 使用高斯差分滤波[10,11]就可以弥补Gamma校正的这部分缺陷, 进一步提取脸部特征, 锐化图像边缘。在实验调试中, 高斯差分滤波器的方差分别取δ1=0.8, δ2=0.9。最后, 为了更进一步地调整图像的亮度, 需要对掩膜图像进行对比均衡化[12,13,14]处理, 最大限度地提取人脸特征、优化人脸识别效果。对比均衡化的算法原理如式 (1) ~式 (3) 所示
式 (2) 中的阈值τ是用来截断经式 (1) 处理过后仍存在的较大像素值, 在实验中:τ=10, a=0.1。经过上述处理后, 仍旧存在的像素点极值可以通过式 (3) 的双曲正切函数来去除。
1.2 处理结果
所提的预处理链技术在MATLAB平台下处理大小为140×170的图片仅耗时60 ms。图2为本文所提出的预处理技术的处理效果图, 以及照度不均图像在预处理前和预处理后的直方图对比图, 经预处理链后, 图片中光线过暗、光照不均匀等问题都得到了很大的改善。因此, 所提方法能很好地去除图像中的噪声点和极值点, 并且有效保留脸部的重要信息。
2 鲁棒的子空间人脸识别方法
在预处理链技术的基础上, 提出了一种基于Gabor变换和NN-SVM分类器的子空间人脸识别方法。本节首先介绍了BDPCA+LDA子空间算法图像降维的方法原理, 接着介绍了Gabor滤波器和基于Gabor变换的BDPCA+LDA人脸识别算法的实现, 然后设计了一种NN-SVM分类器, 最后总结了所提人脸识别方法的识别过程, 并给出了流程图。
2.1 BDPCA (双向PCA) +LDA算法
BDPCA+LDA算法首先利用BDPCA进行特征提取, 获得特征矩阵Y和连接特征矩阵Y的列向量所得的特征向量y, 最后采用LDA进行分类决策。LDA的投影矩阵WLDA=[φ1, φ2, …, φm]是根据最大化Fisher准则来计算的, 即
式中:Sb是y的类间散度矩阵;Sw是y的类内散度矩阵, 且, , 其中C表示数据类别的编号, i为所在类别的编号, u为所有特征向量的均值向量, ui为第i类的均值向量, Ni为第i类的特征向量数, yi, j为第i类的第j组特征向量。φi为Sb和Sw的第i个最大特征值λi所对应的广义特征向量, 它与Sb和Sw之间的关系式为Sbφi=λiSwφi。经过以上计算后, 根据z=WTLDAy便可以提取出最终的特征向量z。
2.2 Gabor变换
Gabor变换属于加窗傅里叶变换, Gabor变换的本质实际上就是对二维图像求卷积。Gabor函数可以在频域的不同尺度和不同方向上提取相关的纹理特征, 并且二维Gabor滤波器是一组具有高斯包络的平面波, 它几乎不受图像中目标对象的位移、形变、旋转、光照等变化的影响, 因此经常用作纹理识别, 并且能取得较好的效果。Gabor滤波器核函数具体定义为
式中:参数u, v分别表示Gabor滤波器的方向和尺度;参数表示高斯半径, z=f (x, y) 表示图像的像素位置;ku, v表示小波向量, 且ku, v=kvexp (iφu) , 其中, kv=kmax/fv, φu=uπ/8, kmax为最大频率, f为频域内核函数的空间因子 (尺度因子) ;项是高斯函数, 通过加窗限制振荡函数的范围;项exp (iku, v·z) 为振荡函数;项用于消除直流分量的影响, 确保滤波器对光照具有一定程度的容忍力。
在本文实验中采用5个不同尺度和8个不同方向组成40个滤波器见图3, Gabor小波向量ku, v=kvexp (iφu) , 各个参数的取值为:kmax=2.5π/2, σ=1.5π, 。则, , φu=uπ/8, 其中, v=1, 2, …, 4, u=0, 1, …, 7。
2.3 基于Gabor变换的BDPCA+LDA人脸识别算法的实现
所构成的Gabor+BDPCA+LDA算法的具体实施方法如下:设人脸训练样本数为M, 对每个人脸样本图进行Gabor变换均能得到N个样本图像, 分别为Mψ1, Mψ2, Mψ3, …, MψN, 那么经Gabor变换后的新训练样本的样本数变为原样本数的M倍, 即M×N个。然后对新的训练样本集进行BDPCA分析, 得到行方向的投影矩阵WR和列方向的投影矩阵WC, 利用这两个投影矩阵对新的样本集进行降维处理。之后分别按行堆叠的方式将降维后的矩阵转换成列向量, 然后再进行LDA分析得到LDA投影矩阵WL。在得到了WR, WC和WL之后, 利用这三个投影矩阵对Gabor变换后的M×N个训练样本进行特征提取, 并将提取的特征保存。最后, 将待识别的人脸图像的N个特征向量合并成一个特征矩阵Y, Y=[y1, y2, …, yn, …, yN], 其中yn为待识别人脸图像经Gabor变换后的第n个输出图像经矩阵WR, WC和WL提取特征后的列向量。将该特征矩阵Y送入分类器就可以进行人脸识别了。
2.4 分类器设计
本文设计的分类器是将最近邻分类器与支持向量机分类器相结合, 简称为NN-SVM分类器。NN-SVM算法的分类原理是基于NN分类[15]算法和SVM分类[16]算法基础之上的, 它是先用NN分类算法和SVM分类算法分别对数据进行数据分类, 然后再进行二次数据分类的算法。假设NN分类距离向量为 (NNClassify (s, c) ) , SVM分类投票结果向量为 (SVMClassify (s, c) ) , 其中s为测试的样本数, c为样本的类别数。那么, NN-SVM分类算法可分为以下3步:
1) 对每一个测试样本分别选取k1维距离最小向量 (NNClassify (s, c) ) 和k2维票数最大的向量 (SVMClassify (s, c) ) 。
2) 联合选取的两个向量形成一个新的k1+k2维向量 (NNSVMClassify (n, k1+k2) ) 。
3) 求 (NNSVMClassify (n, k1+k2) ) 行向量中频率最大的行向量值, 该值即为测试样本的NN-SVM分类结果。
2.5 人脸识别
所提的人脸识别方法如图4所示。首先进行预处理, 然后用Gabor+BDPCA+LDA算法对图像进行降维处理, 提取人脸特征向量, 将提取的人脸特征送入NN-SVM分类器, 将测试集的人脸特征向量与训练集的人脸特征向量进行匹配, 从而确定测试人的身份。
3 实验结果与分析
为了测试本文提出的预处理算法和子空间人脸识别算法的性能, 本文使用FERFT和ORL这两个具有多姿态、多表情和不同照度的人脸数据库进行实验。分别从两个库中各取出20个人的图像, 每个人取出10张图像, 即共400张图像来进行实验。
3.1 光照预处理性能测试
以FERET库和ORL库中的图像作为两个不同的测试集, 在均使用NN-SVM分类器进行分类的前提下, 通过测试LDA, PCA, BDPCA+LDA, Gabor+BDPCA+LDA四种不同算法的等错误率 (EER, EER是贝叶斯决策中最佳阈值对应的错误率, 此时错误接受率和错误拒绝率相等, EER越小表示算法错误率越低) 来评估所提出的预处理链方法的性能, 见表1。对每种算法都运行10次, 求得每次的错误率并取其平均值, 得到的处理结果如图5所示, 这里NONE表示的是被测试样本不经预处理直接进行人脸识别, Used表示被测试样本使用所提预处理方法处理后进行人脸识别。可以看出, 无论是在FERET库还是在ORL库, 经过预处理后的各个算法的等错误率均比未经预处理的等错误率低。而且值得注意的是, 在不使用预处理链的情况下, Gabor+BDPCA+LDA算法的错误率也都在10%以内, 当对图像进行预处理之后错误率都在3%以内。这说明所提出的预处理链方法能够有效抑制光照影响, 而且所提出的Gabor+BDPCA+LDA算法也能很好地抵抗光照影响, 具有很好的鲁棒性。
%
3.2 人脸识别率比较
为了评估所提人脸识别方法的性能, 在FERET和ORL数据库上分两步进行测试。第一步是在均使用NN-SVM分类器的情况下, 测试Gabor+BDPCA+LDA算法与其他子空间算法, 如Fisherfaces, D-LDA, EFM, BDPCA+LDA算法的人脸识别率。图5所示的是Gabor+BDPCA+LDA+NN-SVM算法与其他人脸识别方法在FERET和ORL数据库中的人脸识别率对比, 表2和表3分别显示的是所提算法与其他算法在两大数据库中的最高人脸识别率。
观察图5和表2、表3可知, 其他算法在FERET库中的识别率明显低于其在ORL库中的识别率, 其识别效果不稳定, 而所提方法无论在FERET库还是在ORL库均有很高而且很稳定的人脸识别率, 这说明NN-SVM与Gabor+BDPCA+LDA相结合的人脸识别方法明显优于NN-SVM与其他子空间算法相结合的人脸识别方法。
测试的第二步就是对比Gabor+BDPCA+LDA算法与其他分类算法相结合的人脸识别率, 看是否也能得到很好的识别效果。
从表4和表5可以观察到, Gabor+BDPCA+LDA与NN-SVM相结合的人脸识别方法无论在FERET库还是在ORL库, 均比其他方法的人脸识别率高, 都在90%以上。而且其他方法在FERET数据库的人脸识别率与在ORL数据库的人脸识别率相比均有一定幅度的下降, 而所提方法在两大数据库中的人脸识别率几乎一致, 说明Gabor+BDPCA+LDA与NN-SVM相结合的人脸识别率高于Gabor+BDPCA+LDA与其他分类算法相结合的识别率, 而且对于不同数据库图像的人脸识别具有较好的鲁棒性。
因此, 综合测试的两个步骤不难得知, 所提的人脸识别方法的人脸识别率明显高于其他方法, 而且所提方法对于光照不均、多姿态、多表情、多细节的人脸图像识别具有较好的鲁棒性。
4 结论
本文提出了一种新的子空间人脸识别方法, 该方法使用一种预处理链技术, 解决了光照不均匀情况下部分人脸特征被掩埋的问题, 利用一种基于Gabor变换和NN-SVM分类算法的BDPCA+LDA子空间人脸识别算法进行人脸识别, 有效提高人脸识别率。在FERFT和ORL两大人脸数据库中对所提方法进行评估, 实验结果表明所提出方法不但能够有效消除光照影响, 减少了人脸识别的错误率, 还能够明显提高人脸识别率, 并且对于多姿态、所表情、多细节人脸图像的识别具有很好的鲁棒性。
摘要:针对人脸识别中存在的光照不均匀问题, 提出了一种预处理链技术, 能达到很好的光照补偿效果。为了提高多姿态、多表情、多细节人脸图像的人脸识别率, 设计了一种将最近邻分类器与支持向量机相结合的分类算法 (NN-SVM) , 基于该分类算法提出了一种基于Gabor变换和NN-SVM的子空间人脸识别方法。在FERET和ORL两大人脸数据库中对所提方法进行性能评估, 实验结果表明所提出方法能有效地解决人脸识别中光照不均匀问题, 大大提高人脸识别率, 而且相比其他现有的人脸识别方法, 所设计的方法具有更好、更稳定的识别效果。
8.基于LBP的人脸识别 篇八
关键词:人脸识别;LBP算子;直方图;识别率
中图分类号:TP301 文献标识码:A 文章编号:1009-2374(2013)11-0158-02
1 概述
为了在人脸识别领域得到更好的应用,Ahonen等根据心理学上的研究将人脸进一步划分成不同的区域并赋予不同的权值加以区分,最终取得了良好的识别结果。在这基础上,后续的研究和改进不断出现。文中提出了多尺度区域LBP(MB-LBP)的概念,该方法通过统计区域内的像素均值而非单个像素值得到LBP模式,从而比原有的LBP方法更精确且考虑了更多的宏观信息。
在上述研究的基础上,Tan等人提出了改进的LBP算子的LTP特征。LTP特征的本质是将两单阈值的LBP算子分成双阈值算子并得到上下两个特征,这就能使提取的特征对单个像素点干扰更加稳定。这对基于LBP纹理的人脸识别起到重要作用。本质上,通过不同区域的划分(Multi-block)来组成LBP特征的目的也是尽可能地考虑LBP模式间的位置关系,从而得到更有效的特征。文中提出的Hierarchical Kernel Descriptor的方法通过SIFT、HOG等算子的层级组合得到一组新的特征,即在原有特征层基础上再次特征提取,从而实现大尺度信息提取。因此,应该关注模式间所组成的几何位置关系,即在LBP模式上再提取一层特征,从而以数量的形式反映模式间的几何位置信息。
2 CNCS在VM中的应用
理论上,LBP算子是用于提取图像的边缘和角点信息。显然,这些模式不仅仅只拥有数量关系,其位置的不同也将组合成新的不同的模式或图案,就如同近处看到的图案在远处只能表现为一个像素点,而这些像素点又可以组成新的模式、图案。另一方面,可以把纹理信息分成若干层,较低层的基元形成的某种模式作为较高描述层的次基元,并在一个更高层的描述层次上形成新的模式。因此,不能仅用单个直方图来衡量一个区域的LBP模式。
本文提出了一种新的基于双层LBP的方法,用于提取更多LBP模式之间所具有的几何关系。首先对人脸灰度图像提取LBP特征并得到由该模式组成的图像,从而将特征从像素级提升到区域特征。其次,对LBP模式组成的图像进一步提取LTP算子,从而得到又一组基于LBP模式的特征,用于描述模式间的几何位置关系。通过二者的结合来达到提升识别率的目的。
3 重定义LTP算子
传统的LBP特征实现了从像素级到区域级特征的转变,本文通过双层LBP特征实现对区域特征的进一步描述。LBP特征实现了像素层特征的提取,而第二层的目的是实现LBP层的特征提取,以获得更多的宏观信息。
可以采用与LBP算子相类似的思想,从f1(x,y)提取不同模式之间的关系。通过二值化3×3的区域,可提取出不同模式之间相邻组合关系并统计成直方图。然而,对于灰度值的像素点来说,像素值之间的减法是存在几何意义的,它表示了不同像素点之间的像素差,对图像纹理而言具有物理意义,但对于LBP模式来说,数值只是一种标号,每个标号之间的简单相减不存在任何几何意义。值得注意的是,等号存在一定的物理意义,因此根据这一特性可以将模式数值分成两部分:等于中心点模式和不等于中心点模式。显然,此时两个标号相等意味着两个模式属于同一种模式。但是考虑到像素值可能存在的干扰和误差最终将会影响LBP特征的准确性,对于编码相互接近的LBP模式需要区别对待。如二进制编号11101111的模式和二进制编号为11111111的模式都应该属于同一种模式,因为有极大的可能是由于第四位的像素干扰所引起的不一致。因此定义运算d(x,y)表示两个模式标号之间的大小关系,当|d(x,y)|≤3时,意味着两个模式是一致的。由此可以根据中心点的模式,将周围模式分为两类,|d(x,y)|≤3及|d(x,y)|>3。这与文提出的LTP有着相类似的分类方式。据此本文重新定义了LTP的算子。本文所定义的LTP算子如式(1)所示:
其中d(x,y)表示两个编码之间差异。上式中的LTP算子也是同样提取基于局部区域的特征,但特征提取的层面不同,体现的是不同模式之间的关系。对LBP模式而言,拥有相同直方图的两幅图像,其实际模式的排列组成方式却可能完全不同。因此,通过LTP模式,能够有效地统计出某一模式周围其他模式的组成,从而得到更丰富的人脸信息。
4 结语
经典的LBP应用都是提取LBP及其他扩展的特征后组成直方图进行识别。由于单个LBP模式直方图只能反映不同模式之间的数量关系,缺少了几何位置信息,所以众多的研究通过多尺度的区域和LBP特征的方式来实现位置信息的融入。然而,这样的做法依然忽视了模式与模式之间的几何信息,模式之上依然可能存在着某些模式。因此,本文提出了一种基于LBP模式的双层LBP的概念,通过重定义的LTP特征,在由LBP模式组成的图像上进一步提取其特征模式从而构成新的特征,最终提到了识别率。实验表明,本文所提出的方法对于基于LBP特征的算法有一定的改善,通过重定义的LTP特征,能够在一定程度上提取模式间的几何位置关系,增加人脸识别的有效信息。
参考文献
[1]A.Pentland. Looking at people: sensing for ubiquitous andwearable computing. IEEE Transaction on Pattern Analysis and Machine Intelligence,2000, 22(1):107-119.
[2]T. Kanade, Picture processing system by computercomplex and recognition of human faces, Ph.D.dissertation, Kyoto University, 1973.
[3]H.Chan, W.W. Bledsoe. A man-machine facial recognition system: some preliminary results. Technical report,Panoramic Research Inc., 1965.
[4]A.J. Goldstein, L.D. Harmon, A.B. Lesk. Identificationof human faces. Proceedings of the IEEE,1971,59(5):748-760.
【浅谈人脸识别】推荐阅读:
浅谈人脸识别技术发展06-16
人脸识别技术应用在铁路系统07-18
关于实行人脸识别考勤机考勤的通知08-15
中药饮片识别08-27
学校形象识别策划方案10-03
风险识别与预防措施07-09
生物识别技术发展综述08-10
合同欺诈的识别与防范08-26
ocr证照识别系统方案09-01
推销技巧:如何识别成交信号10-02