有声,玄幻小说完本

人臉識(shí)別的主要算法以及原理

2023-08-01 編輯：運(yùn)營(yíng)部

　　人臉識(shí)別的主要算法以及原理

　　主流的人臉識(shí)別技術(shù)基本上可以歸結(jié)為三類，即：基于幾何特征的方法、基于模板的方法和基于模型的方法。

　　1. 基于幾何特征的方法是最早、最傳統(tǒng)的方法，通常需要和其他算法結(jié)合才能有比較好的效果；

　　2. 基于模板的方法可以分為基于相關(guān)匹配的方法、特征臉方法、線性判別分析方法、奇異值分解方法、神經(jīng)網(wǎng)絡(luò)方法、動(dòng)態(tài)連接匹配方法等。

　　3. 基于模型的方法則有基于隱馬爾柯夫模型，主動(dòng)形狀模型和主動(dòng)外觀模型的方法等。

　　1. 基于幾何特征的方法

　　人臉由眼睛、鼻子、嘴巴、下巴等部件構(gòu)成，正因?yàn)檫@些部件的形狀、大小和結(jié)構(gòu)上的各種差異才使得世界上每個(gè)人臉千差萬(wàn)別，因此對(duì)這些部件的形狀和結(jié)構(gòu)關(guān)系的幾何描述，可以做為人臉識(shí)別的重要特征。幾何特征最早是用于人臉側(cè)面輪廓的描述與識(shí)別，首先根據(jù)側(cè)面輪廓曲線確定若干顯著點(diǎn)，并由這些顯著點(diǎn)導(dǎo)出一組用于識(shí)別的特征度量如距離、角度等。Jia 等由正面灰度圖中線附近的積分投影模擬側(cè)面輪廓圖是一種很有新意的方法。

　　采用幾何特征進(jìn)行正面人臉識(shí)別一般是通過提取人眼、口、鼻等重要特征點(diǎn)的位置和眼睛等重要器官的幾何形狀作為分類特征,但Roder對(duì)幾何特征提取的精確性進(jìn)行了實(shí)驗(yàn)性的研究，結(jié)果不容樂觀。

　　可變形模板法可以視為幾何特征方法的一種改進(jìn)，其基本思想是 :設(shè)計(jì)一個(gè)參數(shù)可調(diào)的器官模型 (即可變形模板),定義一個(gè)能量函數(shù)，通過調(diào)整模型參數(shù)使能量函數(shù)最小化，此時(shí)的模型參數(shù)即做為該器官的幾何特征。

　　這種方法思想很好，但是存在兩個(gè)問題，一是能量函數(shù)中各種代價(jià)的加權(quán)系數(shù)只能由經(jīng)驗(yàn)確定，難以推廣，二是能量函數(shù)優(yōu)化過程十分耗時(shí)，難以實(shí)際應(yīng)用。基于參數(shù)的人臉表示可以實(shí)現(xiàn)對(duì)人臉顯著特征的一個(gè)高效描述，但它需要大量的前處理和精細(xì)的參數(shù)選擇。同時(shí)，采用一般幾何特征只描述了部件的基本形狀與結(jié)構(gòu)關(guān)系，忽略了局部細(xì)微特征，造成部分信息的丟失，更適合于做粗分類，而且目前已有的特征點(diǎn)檢測(cè)技術(shù)在精確率上還遠(yuǎn)不能滿足要求，計(jì)算量也較大。

　　2. 局部特征分析方法（Local Face Analysis）

　　主元子空間的表示是緊湊的，特征維數(shù)大大降低，但它是非局部化的，其核函數(shù)的支集擴(kuò)展在整個(gè)坐標(biāo)空間中，同時(shí)它是非拓?fù)涞?，某個(gè)軸投影后臨近的點(diǎn)與原圖像空間中點(diǎn)的臨近性沒有任何關(guān)系，而局部性和拓?fù)湫詫?duì)模式分析和分割是理想的特性，似乎這更符合神經(jīng)信息處理的機(jī)制，因此尋找具有這種特性的表達(dá)十分重要?；谶@種考慮，Atick提出基于局部特征的人臉特征提取與識(shí)別方法。這種方法在實(shí)際應(yīng)用取得了很好的效果，它構(gòu)成了FaceIt人臉識(shí)別軟件的基礎(chǔ)。

　　3. 特征臉方法（Eigenface或PCA）

　　特征臉方法是90年代初期由Turk和Pentland提出的目前最流行的算法之一，具有簡(jiǎn)單有效的特點(diǎn), 也稱為基于主成分分析(principal component analysis,簡(jiǎn)稱PCA)的人臉識(shí)別方法。

　　特征子臉技術(shù)的基本思想是：從統(tǒng)計(jì)的觀點(diǎn)，尋找人臉圖像分布的基本元素，即人臉圖像樣本集協(xié)方差矩陣的特征向量，以此近似地表征人臉圖像。這些特征向量稱為特征臉(Eigenface)。

　　實(shí)際上，特征臉反映了隱含在人臉樣本集合內(nèi)部的信息和人臉的結(jié)構(gòu)關(guān)系。將眼睛、面頰、下頜的樣本集協(xié)方差矩陣的特征向量稱為特征眼、特征頜和特征唇，統(tǒng)稱特征子臉。特征子臉在相應(yīng)的圖像空間中生成子空間，稱為子臉空間。計(jì)算出測(cè)試圖像窗口在子臉空間的投影距離，若窗口圖像滿足閾值比較條件，則判斷其為人臉。

　　基于特征分析的方法，也就是將人臉基準(zhǔn)點(diǎn)的相對(duì)比率和其它描述人臉臉部特征的形狀參數(shù)或類別參數(shù)等一起構(gòu)成識(shí)別特征向量，這種基于整體臉的識(shí)別不僅保留了人臉部件之間的拓?fù)潢P(guān)系，而且也保留了各部件本身的信息，而基于部件的識(shí)別則是通過提取出局部輪廓信息及灰度信息來(lái)設(shè)計(jì)具體識(shí)別算法?，F(xiàn)在Eigenface(PCA)算法已經(jīng)與經(jīng)典的模板匹配算法一起成為測(cè)試人臉識(shí)別系統(tǒng)性能的基準(zhǔn)算法；而自1991年特征臉技術(shù)誕生以來(lái)，研究者對(duì)其進(jìn)行了各種各樣的實(shí)驗(yàn)和理論分析，F(xiàn)ERET'96測(cè)試結(jié)果也表明，改進(jìn)的特征臉?biāo)惴ㄊ侵髁鞯娜四樧R(shí)別技術(shù)，也是具有最好性能的識(shí)別方法之一。

　　該方法是先確定眼虹膜、鼻翼、嘴角等面像五官輪廓的大小、位置、距離等屬性，然后再計(jì)算出它們的幾何特征量，而這些特征量形成一描述該面像的特征向量。其技術(shù)的核心實(shí)際為“局部人體特征分析”和“圖形/神經(jīng)識(shí)別算法?！边@種算法是利用人體面部各器官及特征部位的方法。如對(duì)應(yīng)幾何關(guān)系多數(shù)據(jù)形成識(shí)別參數(shù)與數(shù)據(jù)庫(kù)中所有的原始參數(shù)進(jìn)行比較、判斷與確認(rèn)。Turk和Pentland提出特征臉的方法，它根據(jù)一組人臉訓(xùn)練圖像構(gòu)造主元子空間，由于主元具有臉的形狀，也稱為特征臉 ,識(shí)別時(shí)將測(cè)試圖像投影到主元子空間上，得到一組投影系數(shù)，和各個(gè)已知人的人臉圖像比較進(jìn)行識(shí)別。Pentland等報(bào)告了相當(dāng)好的結(jié)果，在 200個(gè)人的 3000幅圖像中得到 95%的正確識(shí)別率，在ＦＥＲＥＴ數(shù)據(jù)庫(kù)上對(duì) 150幅正面人臉象只有一個(gè)誤識(shí)別。但系統(tǒng)在進(jìn)行特征臉方法之前需要作大量預(yù)處理工作如歸一化等。

　　在傳統(tǒng)特征臉的基礎(chǔ)上，研究者注意到特征值大的特征向量 (即特征臉 )并不一定是分類性能好的方向，據(jù)此發(fā)展了多種特征 (子空間 )選擇方法，如Peng的雙子空間方法、Weng的線性歧義分析方法、Belhumeur的FisherFace方法等。事實(shí)上，特征臉方法是一種顯式主元分析人臉建模，一些線性自聯(lián)想、線性壓縮型ＢＰ網(wǎng)則為隱式的主元分析方法，它們都是把人臉表示為一些向量的加權(quán)和，這些向量是訓(xùn)練集叉積陣的主特征向量，Valentin對(duì)此作了詳細(xì)討論。總之，特征臉方法是一種簡(jiǎn)單、快速、實(shí)用的基于變換系數(shù)特征的算法，但由于它在本質(zhì)上依賴于訓(xùn)練集和測(cè)試集圖像的灰度相關(guān)性，而且要求測(cè)試圖像與訓(xùn)練集比較像，所以它有著很大的局限性。

　　基于KL 變換的特征人臉識(shí)別方法

　　基本原理:

　　KL變換是圖象壓縮中的一種最優(yōu)正交變換，人們將它用于統(tǒng)計(jì)特征提取，從而形成了子空間法模式識(shí)別的基礎(chǔ)，若將KL變換用于人臉識(shí)別，則需假設(shè)人臉處于低維線性空間，且不同人臉具有可分性，由于高維圖象空間KL變換后可得到一組新的正交基，因此可通過保留部分正交基，以生成低維人臉空間，而低維空間的基則是通過分析人臉訓(xùn)練樣本集的統(tǒng)計(jì)特性來(lái)獲得，KL變換的生成矩陣可以是訓(xùn)練樣本集的總體散布矩陣，也可以是訓(xùn)練樣本集的類間散布矩陣，即可采用同一人的數(shù)張圖象的平均來(lái)進(jìn)行訓(xùn)練，這樣可在一定程度上消除光線等的干擾，且計(jì)算量也得到減少，而識(shí)別率不會(huì)下降。

　　4. 基于彈性模型的方法

　?。蹋幔洌澹蟮热酸槍?duì)畸變不變性的物體識(shí)別提出了動(dòng)態(tài)鏈接模型 (ＤＬＡ)，將物體用稀疏圖形來(lái)描述 (見下圖)，其頂點(diǎn)用局部能量譜的多尺度描述來(lái)標(biāo)記，邊則表示拓?fù)溥B接關(guān)系并用幾何距離來(lái)標(biāo)記，然后應(yīng)用塑性圖形匹配技術(shù)來(lái)尋找最近的已知圖形。Ｗｉｓｃｏｔｔ等人在此基礎(chǔ)上作了改進(jìn)，用ＦＥＲＥＴ圖像庫(kù)做實(shí)驗(yàn)，用 300幅人臉圖像和另外 300幅圖像作比較，準(zhǔn)確率達(dá)到 97.3%。此方法的缺點(diǎn)是計(jì)算量非常巨大。

　　Nastar將人臉圖像 (Ⅰ ) (ｘ，ｙ)建模為可變形的 3Ｄ網(wǎng)格表面 (ｘ，ｙ，Ｉ(ｘ，ｙ) ) (如下圖所示 )，從而將人臉匹配問題轉(zhuǎn)化為可變形曲面的彈性匹配問題。利用有限元分析的方法進(jìn)行曲面變形，并根據(jù)變形的情況判斷兩張圖片是否為同一個(gè)人。這種方法的特點(diǎn)在于將空間 (ｘ，ｙ)和灰度Ｉ(ｘ,ｙ)放在了一個(gè) 3Ｄ空間中同時(shí)考慮，實(shí)驗(yàn)表明識(shí)別結(jié)果明顯優(yōu)于特征臉方法。

　　Lanitis等提出靈活表現(xiàn)模型方法，通過自動(dòng)定位人臉的顯著特征點(diǎn)將人臉編碼為 83個(gè)模型參數(shù)，并利用辨別分析的方法進(jìn)行基于形狀信息的人臉識(shí)別。彈性圖匹配技術(shù)是一種基于幾何特征和對(duì)灰度分布信息進(jìn)行小波紋理分析相結(jié)合的識(shí)別算法，由于該算法較好的利用了人臉的結(jié)構(gòu)和灰度分布信息，而且還具有自動(dòng)精確定位面部特征點(diǎn)的功能，因而具有良好的識(shí)別效果，適應(yīng)性強(qiáng)識(shí)別率較高，該技術(shù)在FERET測(cè)試中若干指標(biāo)名列前茅，其缺點(diǎn)是時(shí)間復(fù)雜度高，速度較慢，實(shí)現(xiàn)復(fù)雜。

　　5. 神經(jīng)網(wǎng)絡(luò)方法（Neural Networks）

　　人工神經(jīng)網(wǎng)絡(luò)是一種非線性動(dòng)力學(xué)系統(tǒng)，具有良好的自組織、自適應(yīng)能力。目前神經(jīng)網(wǎng)絡(luò)方法在人臉識(shí)別中的研究方興未艾。Valentin提出一種方法，首先提取人臉的 50個(gè)主元，然后用自相關(guān)神經(jīng)網(wǎng)絡(luò)將它映射到 5維空間中，再用一個(gè)普通的多層感知器進(jìn)行判別，對(duì)一些簡(jiǎn)單的測(cè)試圖像效果較好；Intrator等提出了一種混合型神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行人臉識(shí)別，其中非監(jiān)督神經(jīng)網(wǎng)絡(luò)用于特征提取，而監(jiān)督神經(jīng)網(wǎng)絡(luò)用于分類。Lee等將人臉的特點(diǎn)用六條規(guī)則描述，然后根據(jù)這六條規(guī)則進(jìn)行五官的定位，將五官之間的幾何距離輸入模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別，效果較一般的基于歐氏距離的方法有較大改善，Laurence等采用卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行人臉識(shí)別，由于卷積神經(jīng)網(wǎng)絡(luò)中集成了相鄰像素之間的相關(guān)性知識(shí)，從而在一定程度上獲得了對(duì)圖像平移、旋轉(zhuǎn)和局部變形的不變性，因此得到非常理想的識(shí)別結(jié)果，Lin等提出了基于概率決策的神經(jīng)網(wǎng)絡(luò)方法 (PDBNN),其主要思想是采用虛擬 (正反例 )樣本進(jìn)行強(qiáng)化和反強(qiáng)化學(xué)習(xí)，從而得到較為理想的概率估計(jì)結(jié)果，并采用模塊化的網(wǎng)絡(luò)結(jié)構(gòu) (OCON)加快網(wǎng)絡(luò)的學(xué)習(xí)。這種方法在人臉檢測(cè)、人臉定位和人臉識(shí)別的各個(gè)步驟上都得到了較好的應(yīng)用，其它研究還有 :Dai等提出用Hopfield網(wǎng)絡(luò)進(jìn)行低分辨率人臉聯(lián)想與識(shí)別，Gutta等提出將RBF與樹型分類器結(jié)合起來(lái)進(jìn)行人臉識(shí)別的混合分類器模型，Phillips等人將MatchingPursuit濾波器用于人臉識(shí)別，國(guó)內(nèi)則采用統(tǒng)計(jì)學(xué)習(xí)理論中的支撐向量機(jī)進(jìn)行人臉分類。

　　神經(jīng)網(wǎng)絡(luò)方法在人臉識(shí)別上的應(yīng)用比起前述幾類方法來(lái)有一定的優(yōu)勢(shì)，因?yàn)閷?duì)人臉識(shí)別的許多規(guī)律或規(guī)則進(jìn)行顯性的描述是相當(dāng)困難的，而神經(jīng)網(wǎng)絡(luò)方法則可以通過學(xué)習(xí)的過程獲得對(duì)這些規(guī)律和規(guī)則的隱性表達(dá)，它的適應(yīng)性更強(qiáng)，一般也比較容易實(shí)現(xiàn)。因此人工神經(jīng)網(wǎng)絡(luò)識(shí)別速度快，但識(shí)別率低。而神經(jīng)網(wǎng)絡(luò)方法通常需要將人臉作為一個(gè)一維向量輸入，因此輸入節(jié)點(diǎn)龐大，其識(shí)別重要的一個(gè)目標(biāo)就是降維處理。

　　PCA的算法描述：利用主元分析法 (即 Principle Component Analysis,簡(jiǎn)稱 PCA)進(jìn)行識(shí)別是由 Anderson和 Kohonen提出的。由于 PCA在將高維向量向低維向量轉(zhuǎn)化時(shí)，使低維向量各分量的方差最大，且各分量互不相關(guān)，因此可以達(dá)到最優(yōu)的特征抽取。

　　6. 其它方法：

　　除了以上幾種方法，人臉識(shí)別還有其它若干思路和方法，包括一下一些：

　　1）隱馬爾可夫模型方法（Hidden Markov Model）

　　2） Gabor 小波變換+圖形匹配

　　（1）精確抽取面部特征點(diǎn)以及基于Gabor引擎的匹配算法，具有較好的準(zhǔn)確性，能夠排除由于面部姿態(tài)、表情、發(fā)型、眼鏡、照明環(huán)境等帶來(lái)的變化。

　?。?）Gabor濾波器將Gaussian網(wǎng)絡(luò)函數(shù)限制為一個(gè)平面波的形狀，并且在濾波器設(shè)計(jì)中有優(yōu)先方位和頻率的選擇，表現(xiàn)為對(duì)線條邊緣反應(yīng)敏感。

　?。?）但該算法的識(shí)別速度很慢，只適合于錄象資料的回放識(shí)別，對(duì)于現(xiàn)場(chǎng)的適應(yīng)性很差。

　　3）人臉等密度線分析匹配方法

　?。?）多重模板匹配方法

　　該方法是在庫(kù)中存貯若干標(biāo)準(zhǔn)面像模板或面像器官模板，在進(jìn)行比對(duì)時(shí)，將采樣面像所有象素與庫(kù)中所有模板采用歸一化相關(guān)量度量進(jìn)行匹配。

　?。?）線性判別分析方法（Linear Discriminant Analysis，LDA）

　?。?）本征臉法

　　本征臉法將圖像看做矩陣 ,計(jì)算本征值和對(duì)應(yīng)的本征向量作為代數(shù)特征進(jìn)行識(shí)別 ,具有無(wú)需提取眼嘴鼻等幾何特征的優(yōu)點(diǎn) ,但在單樣本時(shí)識(shí)別率不高 ,且在人臉模式數(shù)較大時(shí)計(jì)算量大

　?。?）特定人臉子空間(FSS)算法

　　該技術(shù)來(lái)源于但在本質(zhì)上區(qū)別于傳統(tǒng)的"特征臉"人臉識(shí)別方法。"特征臉"方法中所有人共有一個(gè)人臉子空間，而該方法則為每一個(gè)體人臉建立一個(gè)該個(gè)體對(duì)象所私有的人臉子空間，從而不但能夠更好的描述不同個(gè)體人臉之間的差異性，而且最大可能地?cái)P棄了對(duì)識(shí)別不利的類內(nèi)差異性和噪聲，因而比傳統(tǒng)的"特征臉?biāo)惴?quot;具有更好的判別能力。另外，針對(duì)每個(gè)待識(shí)別個(gè)體只有單一訓(xùn)練樣本的人臉識(shí)別問題，提出了一種基于單一樣本生成多個(gè)訓(xùn)練樣本的技術(shù)，從而使得需要多個(gè)訓(xùn)練樣本的個(gè)體人臉子空間方法可以適用于單訓(xùn)練樣本人臉識(shí)別問題。

　?。?）奇異值分解(singular value decomposition,簡(jiǎn)稱SVD)

　　是一種有效的代數(shù)特征提取方法.由于奇異值特征在描述圖像時(shí)是穩(wěn)定的,且具有轉(zhuǎn)置不變性、旋轉(zhuǎn)不變性、位移不變性、鏡像變換不變性等重要性質(zhì),因此奇異值特征可以作為圖像的一種有效的代數(shù)特征描述。奇異值分解技術(shù)已經(jīng)在圖像數(shù)據(jù)壓縮、信號(hào)處理和模式分析中得到了廣泛應(yīng)用.

　　7. 面像識(shí)別的主要商業(yè)系統(tǒng)

　　90年代中后期以來(lái)，一些商業(yè)性的面像識(shí)別系統(tǒng)開始進(jìn)入市場(chǎng)。目前，主要商業(yè)系統(tǒng)包括：

　　● Visionics公司的FaceIt面像識(shí)別系統(tǒng)，該系統(tǒng)基于Rockefeller大學(xué)開發(fā)的局部特征分析(LFA)算法；

　　● Lau Tech.公司的面像識(shí)別/確認(rèn)系統(tǒng)，采用MIT技術(shù)；

　　● Miros公司的Trueface及eTrue身份驗(yàn)證系統(tǒng)，其核心技術(shù)為神經(jīng)網(wǎng)絡(luò)；

　　● C-VIS公司的面像識(shí)別/確認(rèn)系統(tǒng)；

　　● Banque-Tec.公司的身份驗(yàn)證系統(tǒng)；

　　● Visage Gallery’s 身份認(rèn)證系統(tǒng)，基于MIT媒體實(shí)驗(yàn)室的Eigenface技術(shù)；

　　● Plettac Electronic’s FaceVACS出入控制系統(tǒng)；

　　● 臺(tái)灣的BioID系統(tǒng)，它基于人臉、唇動(dòng)和語(yǔ)音三者信息融合的Biometrics系統(tǒng)。

　　其中，F(xiàn)aceIt系統(tǒng)是最具有代表性的商業(yè)產(chǎn)品，目前已在很多地方得到了應(yīng)用。去年，它在英國(guó)用于被稱為“Mandrake”的反罪犯系統(tǒng)中，該系統(tǒng)在144個(gè)監(jiān)控?cái)z像機(jī)采集的視頻序列中搜索已知的罪犯或者嫌疑犯，如發(fā)現(xiàn)可能的罪犯，系統(tǒng)將通知中心控制室的警員。

　　筆者曾使用過FaceIt系統(tǒng)，并對(duì)其進(jìn)行了各項(xiàng)指標(biāo)的評(píng)測(cè)。結(jié)果表明，該系統(tǒng)在控制光照、準(zhǔn)正面（3坐標(biāo)軸上的旋轉(zhuǎn)不超過15度）、無(wú)飾物的情況下具有較好的識(shí)別性能。但在實(shí)用過程中也發(fā)現(xiàn)，只有訓(xùn)練集人臉圖像的采集條件與測(cè)試集人臉圖像的采集條件基本一致時(shí)才能具有良好的識(shí)別性能，否則，其性能將急劇下降，尤其光照變化、姿態(tài)變化、黑框眼鏡、帽子、夸張的表情、胡須和長(zhǎng)發(fā)等對(duì)其性能的影響更大。

　　面像識(shí)別系統(tǒng)的測(cè)試

　　基于對(duì)面像識(shí)別技術(shù)在軍事安全等領(lǐng)域重要性的考慮，美國(guó)國(guó)防部的ARPA資助建立了一個(gè)對(duì)現(xiàn)有面像識(shí)別技術(shù)進(jìn)行評(píng)測(cè)的程序，并分別于1994年8月、1995年3月和1996年9月（截至1997年3月）組織了三次面像識(shí)別和人臉確認(rèn)的性能評(píng)測(cè)，其目的是要展示面像識(shí)別研究的最新進(jìn)展和最高學(xué)術(shù)水平，同時(shí)發(fā)現(xiàn)現(xiàn)有面像識(shí)別技術(shù)所面臨的主要問題，為以后的研究提供方向性指南。盡管該測(cè)試只對(duì)美國(guó)研究機(jī)構(gòu)開放，但它在事實(shí)上成為了該領(lǐng)域的公認(rèn)測(cè)試標(biāo)準(zhǔn)，其測(cè)試結(jié)果已被認(rèn)為反映了面像識(shí)別研究的最高學(xué)術(shù)水平。

　　根據(jù)2000年公開發(fā)表的FERET’97測(cè)試報(bào)告，美國(guó)南加州大學(xué)(USC)、馬里蘭大學(xué)(UMD)、麻省理工學(xué)院(MIT)等研究機(jī)構(gòu)的面像識(shí)別技術(shù)具有最好的識(shí)別性能。在訓(xùn)練集和測(cè)試集攝像條件相似的200人的識(shí)別測(cè)試中，幾個(gè)系統(tǒng)都產(chǎn)生了接近100%的識(shí)別率。值得一提的是，即使是最簡(jiǎn)單的相關(guān)匹配算法也具有很高的識(shí)別性能。在更大對(duì)象集的FERET測(cè)試中（人數(shù)大于等于1166人），在同一攝像條件下采集的正面圖像識(shí)別中，最高首選識(shí)別率為95%；而對(duì)用不同的攝像機(jī)和不同的光照條件采集的測(cè)試圖像，最高首選識(shí)別率驟降為82%；對(duì)一年后采集的圖像測(cè)試，最大的準(zhǔn)確率僅僅接近51%。

　　該測(cè)試結(jié)果表明，目前的面像識(shí)別算法對(duì)于不同的攝像機(jī)、不同的光照條件和年齡變化的適應(yīng)能力非常差，理應(yīng)得到研究者的足夠重視。而且值得注意的是，該測(cè)試中所用的人臉圖像均為比較標(biāo)準(zhǔn)的正面人臉圖像，姿態(tài)變化非常小，也沒有夸張的表情和飾物，以及沒有提及面部毛發(fā)改變的情況。所以，我們認(rèn)為，除了FERET測(cè)試所揭示的上述面像識(shí)別研究需要面對(duì)的問題之外，還需要考慮諸如姿態(tài)、飾物（眼鏡、帽子等）、面部表情、面部毛發(fā)等可變因素對(duì)面像識(shí)別性能的影響。這些因素也是開發(fā)實(shí)用的面像識(shí)別產(chǎn)品時(shí)必然會(huì)遇到的最關(guān)鍵的技術(shù)問題。

　　為進(jìn)一步測(cè)試商業(yè)面像識(shí)別系統(tǒng)的性能，并揭示2000年前后面像識(shí)別技術(shù)的最新進(jìn)展，美國(guó)國(guó)防部的反毒品技術(shù)開發(fā)計(jì)劃辦公室于去年5月和6月對(duì)美國(guó)的主要商業(yè)面像識(shí)別系統(tǒng)進(jìn)行了評(píng)測(cè)，稱為FRVT’2000（Face Recognition Vender Test）評(píng)測(cè)。該計(jì)劃邀請(qǐng)了美國(guó)所有面像識(shí)別系統(tǒng)廠商參加，共24家，但只有8家響應(yīng)，最終有5家公司參加了評(píng)測(cè)，而只有3家的系統(tǒng)在規(guī)定時(shí)間內(nèi)完成了全部對(duì)比實(shí)驗(yàn)。可以認(rèn)為，這3家公司的產(chǎn)品是目前最具競(jìng)爭(zhēng)力的商業(yè)識(shí)別系統(tǒng)，它們分別是FaceIt系統(tǒng)、Lau Tech.公司的系統(tǒng)和C-VIS公司的系統(tǒng)。FRVT’2000評(píng)估了這些系統(tǒng)對(duì)圖像壓縮、用戶-攝像機(jī)距離、表情、光照、錄制設(shè)備、姿態(tài)、分辨率和時(shí)間間隔等影響因素的識(shí)別性能。結(jié)果表明，面像識(shí)別系統(tǒng)的性能與1997年的測(cè)試相比有了一定的進(jìn)步，但其識(shí)別性能對(duì)各種條件，如光照、老化、距離、姿態(tài)等，仍然離人們的期望值較遠(yuǎn)。

　　國(guó)內(nèi)：

　　中科院－上海銀晨

　　近年來(lái)，國(guó)內(nèi)學(xué)者在對(duì)特征臉技術(shù)進(jìn)行認(rèn)真研究的基礎(chǔ)上，嘗試了基于特征臉特征提取方法和各種后端分類器相結(jié)合的方法，并提出了各種各樣的改進(jìn)版本或擴(kuò)展算法，主要的研究?jī)?nèi)容包括線性/非線性判別分析(LDA/KDA)、Bayesian概率模型、支持矢量機(jī)（SVM）、人工神經(jīng)網(wǎng)絡(luò)(NN)以及類內(nèi)和類間雙子空間(inter/intra-class dual subspace)分析方法等等。

　　近年來(lái)，中科院計(jì)算所在對(duì)特征臉技術(shù)進(jìn)行認(rèn)真研究的基礎(chǔ)上，嘗試了基于特征臉特征提取方法和各種后端分類器相結(jié)合的方法，并提出了各種各樣的改進(jìn)版本或擴(kuò)展算法，主要的研究?jī)?nèi)容包括線性/非線性判別分析(LDA/KDA)、Bayesian概率模型、支持矢量機(jī)（SVM）、人工神經(jīng)網(wǎng)絡(luò)(NN)以及類內(nèi)和類間雙子空間(inter/intra-class dual subspace)分析方法等等。

　　針對(duì)Eigenface算法的缺點(diǎn)，中科院計(jì)算所提出了特定人臉子空間(FSS)算法。該技術(shù)來(lái)源于但在本質(zhì)上區(qū)別于傳統(tǒng)的"特征臉"人臉識(shí)別方法："特征臉"方法中所有人共有一個(gè)人臉子空間，而中科院計(jì)算所的方法則為每一個(gè)體人臉建立一個(gè)該個(gè)體對(duì)象所私有的人臉子空間，從而不但能夠更好的描述不同個(gè)體人臉之間的差異性，而且最大可能地?cái)P棄了對(duì)識(shí)別不利的類內(nèi)差異性和噪聲，因而比傳統(tǒng)的"特征臉?biāo)惴?quot;具有更好的判別能力。另外，針對(duì)每個(gè)待識(shí)別個(gè)體只有單一訓(xùn)練樣本的人臉識(shí)別問題，中科院計(jì)算所提出了一種基于單一樣本生成多個(gè)訓(xùn)練樣本的技術(shù)，從而使得需要多個(gè)訓(xùn)練樣本的個(gè)體人臉子空間方法可以適用于單訓(xùn)練樣本人臉識(shí)別問題。在Yale人臉庫(kù)、本實(shí)驗(yàn)室350人圖像庫(kù)上的對(duì)比實(shí)驗(yàn)也表明中科院計(jì)算所提出的方法比傳統(tǒng)的特征臉方法、模板匹配方法對(duì)表情、光照、和一定范圍內(nèi)的姿態(tài)變化具有更好的魯棒性，具有更優(yōu)的識(shí)別性能。

　　彈性圖匹配技術(shù)是一種基于幾何特征和對(duì)灰度分布信息進(jìn)行小波紋理分析相結(jié)合的識(shí)別算法，由于該算法較好的利用了人臉的結(jié)構(gòu)和灰度分布信息，而且還具有自動(dòng)精確定位面部特征點(diǎn)的功能，因而具有良好的識(shí)別效果，該技術(shù)在FERET測(cè)試中若干指標(biāo)名列前茅，其缺點(diǎn)是時(shí)間復(fù)雜度高，實(shí)現(xiàn)復(fù)雜。中科院計(jì)算所對(duì)該算法進(jìn)行了研究，并提出了一些啟發(fā)策略。

　　人臉識(shí)別關(guān)鍵問題研究

　　a) 人臉識(shí)別中的光照問題

　　光照變化是影響人臉識(shí)別性能的最關(guān)鍵因素，對(duì)該問題的解決程度關(guān)系著人臉識(shí)別實(shí)用化進(jìn)程的成敗。中科院計(jì)算所將在對(duì)其進(jìn)行系統(tǒng)分析的基礎(chǔ)上，考慮對(duì)其進(jìn)行量化研究的可能性，其中包括對(duì)光照強(qiáng)度和方向的量化、對(duì)人臉反射屬性的量化、面部陰影和照度分析等等。在此基礎(chǔ)上，考慮建立描述這些因素的數(shù)學(xué)模型，以便利用這些光照模型，在人臉圖像預(yù)處理或者歸一化階段盡可能的補(bǔ)償乃至消除其對(duì)識(shí)別性能的影響。重點(diǎn)研究如何在從人臉圖像中將固有的人臉屬性（反射率屬性、3D表面形狀屬性）和光源、遮擋及高光等非人臉固有屬性分離開來(lái)?；诮y(tǒng)計(jì)視覺模型的反射率屬性估計(jì)、3D表面形狀估計(jì)、光照模式估計(jì)，以及任意光照?qǐng)D像生成算法是中科院計(jì)算所的主要研究?jī)?nèi)容。具體考慮兩種不同的解決思路：

　　1、利用光照模式參數(shù)空間估計(jì)光照模式，然后進(jìn)行針對(duì)性的光照補(bǔ)償，以便消除非均勻正面光照造成的陰影、高光等影響；

　　2、基于光照子空間模型的任意光照?qǐng)D像生成算法，用于生成多個(gè)不同光照條件的訓(xùn)練樣本，然后利用具有良好的學(xué)習(xí)能力的人臉識(shí)別算法，如子空間法，SVM等方法進(jìn)行識(shí)別，

　　b) 人臉識(shí)別中的姿態(tài)問題研究

　　姿態(tài)問題涉及頭部在三維垂直坐標(biāo)系中繞三個(gè)軸的旋轉(zhuǎn)造成的面部變化，其中垂直于圖像平面的兩個(gè)方向的深度旋轉(zhuǎn)會(huì)造成面部信息的部分缺失。使得姿態(tài)問題成為人臉識(shí)別的一個(gè)技術(shù)難題。解決姿態(tài)問題有三種思路：

　　第一種思路是學(xué)習(xí)并記憶多種姿態(tài)特征，這對(duì)于多姿態(tài)人臉數(shù)據(jù)可以容易獲取的情況比較實(shí)用，其優(yōu)點(diǎn)是算法與正面人臉識(shí)別統(tǒng)一，不需要額外的技術(shù)支持，其缺點(diǎn)是存儲(chǔ)需求大，姿態(tài)泛化能力不能確定，不能用于基于單張照片的人臉識(shí)別算法中等。

　　第二種思路是基于單張視圖生成多角度視圖，可以在只能獲取用戶單張照片的情況下合成該用戶的多個(gè)學(xué)習(xí)樣本，可以解決訓(xùn)練樣本較少的情況下的多姿態(tài)人臉識(shí)別問題，從而改善識(shí)別性能。

　　第三種思路是基于姿態(tài)不變特征的方法，即尋求那些不隨姿態(tài)的變化而變化的特征。中科院計(jì)算所的思路是采用基于統(tǒng)計(jì)的視覺模型，將輸入姿態(tài)圖像校正為正面圖像，從而可以在統(tǒng)一的姿態(tài)空間內(nèi)作特征的提取和匹配。

　　因此，基于單姿態(tài)視圖的多姿態(tài)視圖生成算法將是中科院計(jì)算所要研究的核心算法，中科院計(jì)算所的基本思路是采用機(jī)器學(xué)習(xí)算法學(xué)習(xí)姿態(tài)的2D變化模式，并將一般人臉的3D模型作為先驗(yàn)知識(shí)，補(bǔ)償2D姿態(tài)變換中不可見的部分，并將其應(yīng)用到新的輸入圖像上去。