一文看懂人臉識別(4個特點+4個實現步驟+5個難點+算法發展軌跡)

人臉識別是身份識別的一種方式,目的就是要判斷圖片和視頻中人臉的身份時什么。 本文將詳細介紹人臉識別的4個特點、4個步驟、5個難點及算法的發展軌跡。

一文看懂人臉識別

人臉識別是身份識別的一種方式,目的就是要判斷圖片和視頻中人臉的身份時什么。本文將詳細介紹人臉識別的4個特點、4個步驟、5個難點及算法的發展軌跡。

什么是人臉識別?

人臉識別是 計算機視覺-computer Vision 領域里很典型的應用。

人臉識別的目的就是要判斷圖片和視頻(視頻是由圖片構成的)中人臉的身份是什么。

人臉識別是身份識別的一種,它跟身份證識別、指紋識別、虹膜識別都是相似的。可以將人臉識別和大家熟悉的身份證做對比:

人臉識別是身份識別的一種

  1. 錄入信息(開通身份證 – 錄入人臉信息)
  2. 將信息存入數據庫(身份證信息 – 人臉信息)
  3. 當需要驗證身份時,將新采集信息和數據庫信息作比對(掃身份證 – 刷臉)

人臉識別有4個特點

人臉識別和其他身份識別相比,有4個特點:

人臉識別的4個特點

  1. 便捷性。人臉是生物特征,不需要攜帶類似身份證的東西
  2. 非強制性。識別的過程甚至不需要對象的配合,只要拍攝到人臉就可以進行識別,例如安防領域就是如此。
  3. 非接觸性。不需要跟設備進行接觸,相比指紋更加安全一些。
  4. 并行處理。一張照片里有多個人臉時可以一起處理,不像指紋和虹膜,需要一個一個來。

基于以上特點,人臉識別正在被廣泛的應用在各個領域。大家在生活中隨處都可以看到人臉識別的應用。

人臉識別的 4 個步驟

人臉識別的過程中有4個關鍵的步驟:

  1. 人臉檢測
  2. 人臉對齊
  3. 人臉編碼
  4. 人臉匹配

人臉識別的4個步驟

下面詳細說明一下這4個步驟。

人臉檢測

人臉檢測的目的是尋找圖片中人臉的位置。當發現有人臉出現在圖片中時,不管這個臉是誰,都會標記出人臉的坐標信息,或者將人臉切割出來。

可以使用方向梯度直方圖(HOG)來檢測人臉位置。先將圖片灰度化,接著計算圖像中像素的梯度。通過將圖像轉變成HOG形式,就可以獲得人臉位置。

人臉檢測方法-HOG

人臉對齊

人臉對齊是將不同角度的人臉圖像對齊成同一種標準的形狀。

先定位人臉上的特征點,然后通過幾何變換(仿射、旋轉、縮放),使各個特征點對齊(將眼睛、嘴等部位移到相同位置)。

人臉對齊-特征點對齊

人臉編碼

人臉圖像的像素值會被轉換成緊湊且可判別的特征向量,這也被稱為模板(template)。理想情況下,同一個主體的所有人臉都應該映射到相似的特征向量。

人臉編碼

人臉匹配

在人臉匹配構建模塊中,兩個模板會進行比較,從而得到一個相似度分數,該分數給出了兩者屬于同一個主體的可能性。

人臉匹配

人臉識別的 5 個難點

人臉圖像在現實世界中的呈現具有高度的可變性。所以人臉識別也是最有挑戰性的生物識別方法之一。人臉圖像可變的地方包括:

  1. 頭部姿勢
  2. 年齡
  3. 遮擋
  4. 光照條件
  5. 人臉表情

人臉識別的5個難點

人臉識別算法的發展軌跡

人臉識別領域,也是從傳統機器學習算法過度到深度學習算法的。

人臉識別算法的發展軌跡

傳統機器學習算法

在機器學習階段,人臉識別也經歷了3個重要的階段:

  1. 幾何特征階段
  2. 表象特征階段
  3. 紋理特征階段

深度學習算法

在深度學習階段,算法的發展也同樣經歷了3個階段:

  1. 從最開始的 VGG 網絡到 Inception 網絡再到 Resnet 網絡,網絡模型總體上呈現出更深,更寬的趨勢。
  2. 曠視、商湯為代表的在學術公開競賽中取得好成績的這些廠商,開始發展實際業務為起點,通過不斷擴大他們的實際數據集合,算法性能也在逐漸的提升。
  3. 進一步增加數據量以提升算法性能以外,與第一階段相反,大家開始在不降低識別性能的基礎上,研究網絡的輕量化。輕量化的主要目的有兩個,一個是提升算法的速度,甚至能夠部署到移動端;另外一個就是便于硬件實現,從而將人臉識別算法直接做成一個硬件模塊。

想要詳細了解不同階段的技術細節,可以看這篇文章《一文看懂人臉識別技術發展脈絡

人臉識別的典型應用

人臉識別的應用變得越來越廣泛,只要跟身份識別相關的未來都有可能使用人臉識別。下面列幾個典型的應用場景。

  1. 門禁系統
  2. 安防系統
  3. 無人超市
  4. 電子護照及身份證
  5. 自主服務系統(如ATM)
  6. 信息安全系統,如刷臉支付
  7. 娛樂型應用,如抖音里的部分道具

本文首發自easyAI,原位地址:《一文看懂人臉識別(4個特點+4個實現步驟+5個難點+算法發展軌跡)》

0條評論 添加新討論

登錄后參與討論
Ctrl+Enter 發表