人臉識別是身份識別的一種方式,目的就是要判斷圖片和視頻中人臉的身份時什么。 本文將詳細介紹人臉識別的4個特點、4個步驟、5個難點及算法的發展軌跡。
人臉識別是身份識別的一種方式,目的就是要判斷圖片和視頻中人臉的身份時什么。本文將詳細介紹人臉識別的4個特點、4個步驟、5個難點及算法的發展軌跡。
什么是人臉識別?
人臉識別是 計算機視覺-computer Vision 領域里很典型的應用。
人臉識別的目的就是要判斷圖片和視頻(視頻是由圖片構成的)中人臉的身份是什么。
人臉識別是身份識別的一種,它跟身份證識別、指紋識別、虹膜識別都是相似的。可以將人臉識別和大家熟悉的身份證做對比:
- 錄入信息(開通身份證 – 錄入人臉信息)
- 將信息存入數據庫(身份證信息 – 人臉信息)
- 當需要驗證身份時,將新采集信息和數據庫信息作比對(掃身份證 – 刷臉)
人臉識別有4個特點
人臉識別和其他身份識別相比,有4個特點:
- 便捷性。人臉是生物特征,不需要攜帶類似身份證的東西
- 非強制性。識別的過程甚至不需要對象的配合,只要拍攝到人臉就可以進行識別,例如安防領域就是如此。
- 非接觸性。不需要跟設備進行接觸,相比指紋更加安全一些。
- 并行處理。一張照片里有多個人臉時可以一起處理,不像指紋和虹膜,需要一個一個來。
基于以上特點,人臉識別正在被廣泛的應用在各個領域。大家在生活中隨處都可以看到人臉識別的應用。
人臉識別的 4 個步驟
人臉識別的過程中有4個關鍵的步驟:
- 人臉檢測
- 人臉對齊
- 人臉編碼
- 人臉匹配
下面詳細說明一下這4個步驟。
人臉檢測
人臉檢測的目的是尋找圖片中人臉的位置。當發現有人臉出現在圖片中時,不管這個臉是誰,都會標記出人臉的坐標信息,或者將人臉切割出來。
可以使用方向梯度直方圖(HOG)來檢測人臉位置。先將圖片灰度化,接著計算圖像中像素的梯度。通過將圖像轉變成HOG形式,就可以獲得人臉位置。
人臉對齊
人臉對齊是將不同角度的人臉圖像對齊成同一種標準的形狀。
先定位人臉上的特征點,然后通過幾何變換(仿射、旋轉、縮放),使各個特征點對齊(將眼睛、嘴等部位移到相同位置)。
人臉編碼
人臉圖像的像素值會被轉換成緊湊且可判別的特征向量,這也被稱為模板(template)。理想情況下,同一個主體的所有人臉都應該映射到相似的特征向量。
人臉匹配
在人臉匹配構建模塊中,兩個模板會進行比較,從而得到一個相似度分數,該分數給出了兩者屬于同一個主體的可能性。
人臉識別的 5 個難點
人臉圖像在現實世界中的呈現具有高度的可變性。所以人臉識別也是最有挑戰性的生物識別方法之一。人臉圖像可變的地方包括:
- 頭部姿勢
- 年齡
- 遮擋
- 光照條件
- 人臉表情
人臉識別算法的發展軌跡
人臉識別領域,也是從傳統機器學習算法過度到深度學習算法的。
傳統機器學習算法
在機器學習階段,人臉識別也經歷了3個重要的階段:
- 幾何特征階段
- 表象特征階段
- 紋理特征階段
深度學習算法
在深度學習階段,算法的發展也同樣經歷了3個階段:
- 從最開始的 VGG 網絡到 Inception 網絡再到 Resnet 網絡,網絡模型總體上呈現出更深,更寬的趨勢。
- 曠視、商湯為代表的在學術公開競賽中取得好成績的這些廠商,開始發展實際業務為起點,通過不斷擴大他們的實際數據集合,算法性能也在逐漸的提升。
- 進一步增加數據量以提升算法性能以外,與第一階段相反,大家開始在不降低識別性能的基礎上,研究網絡的輕量化。輕量化的主要目的有兩個,一個是提升算法的速度,甚至能夠部署到移動端;另外一個就是便于硬件實現,從而將人臉識別算法直接做成一個硬件模塊。
想要詳細了解不同階段的技術細節,可以看這篇文章《一文看懂人臉識別技術發展脈絡》
人臉識別的典型應用
人臉識別的應用變得越來越廣泛,只要跟身份識別相關的未來都有可能使用人臉識別。下面列幾個典型的應用場景。
- 門禁系統
- 安防系統
- 無人超市
- 電子護照及身份證
- 自主服務系統(如ATM)
- 信息安全系統,如刷臉支付
- 娛樂型應用,如抖音里的部分道具
本文首發自easyAI,原位地址:《一文看懂人臉識別(4個特點+4個實現步驟+5個難點+算法發展軌跡)》
0條評論 添加新討論