关于人脸识别的最全研究!

  本文内容涵盖人脸识别发展历程、市场研究、核心技术、商业应用以及产业落地、个人看法等干货研究。注意,本文干货满满,约有2万7千字,强烈建议大家先收藏后学习!

关于人脸识别的最全研究!

图片来源:pixabay

  01 发展史

  1. 人脸识别的理解

  人脸识别(Face Recognition)是一种依据人的面部特征(如统计或几何特征等),自动进行身份识别的一种生物识别技术,又称为面像识别、人像识别、相貌识别、面孔识别、面部识别等。通常我们所说的人脸识别是基于光学人脸图像的身份识别与验证的简称。

  人脸识别利用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸图像进行一系列的相关应用操作。技术上包括图像采集、特征定位、身份的确认和查找等等。简单来说,就是从照片中提取人脸中的特征,比如眉毛高度、嘴角等等,再通过特征的对比输出结果。

  2. 人脸识别的发展简史

  第一阶段(1950s—1980s)初级阶段

  人脸识别被当作一个一般性的模式识别问题,主流技术基于人脸的几何结构特征。这集中体现在人们对于剪影(Profile)的研究上,人们对面部剪影曲线的结构特征提取与分析方面进行了大量研究。人工神经网络也一度曾经被研究人员用于人脸识别问题中。较早从事 AFR 研究的研究人员除了布莱索(Bledsoe)外还有戈登斯泰因(Goldstein)、哈蒙(Harmon)以及金出武雄(Kanade Takeo)等。总体而言,这一阶段是人脸识别研究的初级阶段,非常重要的成果不是很多,也基本没有获得实际应用。

  第二阶段(1990s)高潮阶段

  这一阶段尽管时间相对短暂,但人脸识别却发展迅速,不但出现了很多经典的方法,例如Eigen Face, Fisher Face和弹性图匹配;并出现了若干商业化运作的人脸识别系统,比如最为著名的 Visionics(现为 Identix)的 FaceIt 系统。 从技术方案上看, 2D人脸图像线性子空间判别分析、统计表观模型、统计模式识别方法是这一阶段内的主流技术。

  第三阶段(1990s末~现在)

  人脸识别的研究不断深入,研究者开始关注面向真实条件的人脸识别问题,主要包括以下四个方面的研究:1)提出不同的人脸空间模型,包括以线性判别分析为代表的线性建模方法,以Kernel方法为代表的非线性建模方法和基于3D信息的3D人脸识别方法。2)深入分析和研究影响人脸识别的因素,包括光照不变人脸识别、姿态不变人脸识别和表情不变人脸识别等。3)利用新的特征表示,包括局部描述子(Gabor Face, LBP Face等)和深度学习方法。4)利用新的数据源,例如基于视频的人脸识别和基于素描、近红外图像的人脸识别。

  02 市场研究

  1. 全球人脸识别市场

  前瞻根据人脸识别行业发展现状;到2016年,全球生物识别市场规模在127.13亿美元左右,其中人脸识别规模约26.53亿美元,占比在20%左右。预计到2021年,全球人脸识别市场预计将达到63.7亿美元,按预计期间的复合增长率达17.83%。

关于人脸识别的最全研究!

  2. 中国人脸识别市场

  前瞻根据人脸识别行业发展现状,估算我国人脸识别市场规模约占全球市场的10%左右。2010-2016年,我国人脸识别市场规模逐年增长,年均复合增长率达27%。2016年,我国人脸识别行业市场规模约为17.25亿元,同比增长27.97%,增速较上年上升4.64个百分点。

关于人脸识别的最全研究!

  3. 国内主要玩家分布

  3.1 中国部分人脸识别公司(排名不分先后)

关于人脸识别的最全研究!
关于人脸识别的最全研究!

  3.2 四大独角兽介绍及对比细分领域

  (1)旷视科技:

  2014年,获阿里巴巴旗下蚂蚁金服投资,主攻金融和监控两大行业,有子公司旷视智安;团队成员除了几名来自清华校友外,还有来自美国哥伦比亚大学、英国牛津大学和美国南加州大学的科研及开发人员,截至目前员工仅有100余人。

  在金融、安防、零售领域分别开始了商业化探索成功发育出Face++Financial,Face++Security,Face++BI等垂直人脸验证解决方案,主要将人脸识别应用在互联网产品上,自己做研发,在美图秀秀、淘宝等互联网领域得到良好的应用,在金融领域的市场一直占据沙发前排阵营;2016年获得上亿元C轮融资,最后选择通过计算机视觉技术与NLP技术的结合,制造出能“识别万物”的智能机器人,提供硬件模组,里面内置他们家的算法。目前正在准备启动IPO的步伐,VIE架构让他们得以绕过A股,不用达到连续三年盈利的标准实现快速上市。

  (2)商汤科技:

  SenseTime(商汤科技),获IDG资本投资,主攻金融、移动互联网、安防监控三大行业;由香港中文大学的汤晓欧创建,“商汤”中的汤指的就是汤晓欧本人,汤晓鸥及其研究团队所开发的DeepID算法率先将深度学习应用到人脸识别上,在技术指标上实现了新的突破。主要案例是围绕各个美化软件与直播平台制作人脸贴图,重点强化了人脸识别的关键点检测及跟踪技术。

  团队有300多号,也从当初toC转向toB领域;成立于2014年的商汤科技选择另辟蹊径,选择用“四大美女”这个话题让人们躁动起来,到最后四大美女走了三个;商汤的网络都是自己设计的,这样对于深度学习网络的掌控力就会更强,提供SaaS服务的同时,可以通过SaaS把背后的数据拿到,再进行更多更细致的分析再次提升服务质量。

  (3)云从科技:

  2015年4月,周曦拿到战略投资成立云从科技,同年针对金融和银行业推出了40多种解决方案,包含从算法、产品、销售、售后的全产业链打造,针对农行、建行、交行、中行及多地公安提供定制化服务。团队成员除了来自中科大的校友外,还来自中国科学院各大研究所、UIUC、IBM、NEC、MicroSoft等全球顶尖学府及研究机构。

  截止2016年11月,成立一年半,研发团队扩展为200余名,核心产品是人脸识别系统及IBIS集成生物识别平台,还具备3D模型、红外活体、静默活体等技术,可根据场景需求自由调节。选择连接硬件、开发与技术,属于全产业链模式,因为人脸识别系统多数情况下需要深度定制,只有这样,才能在客户提出需求的情况下迅速反馈,修改,统一用户体验。

  (4)依图科技:

  2012 年九月,朱珑与他的好友林晨曦在创立依图科技,这家从事人工智能创新性研究的创企从图像识别入手,首先与全国省市级公安系统合作,对车辆品牌、型号等进行精准识别,随后扩展到人像识别,通过静态人像比对技术和动态人像比对技术,协助公安系统进行人员身份核查、追逃、监控、关系挖掘等。

  发展近6年,依图科技的产品已经应用到全国二十多个省市地区的安防领域,安防领域之外,依图也进入智慧城市领域和健康医疗领域,它要协助政府构建"城市大脑",也希望将医疗领域的巨大知识鸿沟缩小,改善医患体验。

  (5)细分领域对比表

关于人脸识别的最全研究!

  (6)主要客户对比

关于人脸识别的最全研究!

  4. 商业模式

  4.1 人脸识别商业模式设计步骤

关于人脸识别的最全研究!

  4.2 人脸识别盈利模式

关于人脸识别的最全研究!

  03 人脸识别的流程及主要技术

  1. 人脸识别系统组成

关于人脸识别的最全研究!

  2. 人脸识别的一般流程

  2.1 人脸采集

  (1)简介

  不同的人脸图像通过摄像镜头采集得到,比如静态图像、动态图像、不同的位置、不同表情等,当采集对象在设备的拍摄范围内时,采集设备会自动搜索并拍摄人脸图像。

  (2)人脸采集的主要影响因素

  图像大小:人脸图像过小会影响识别效果,人脸图像过大会影响识别速度。非专业人脸识别摄像头常见规定的最小识别人脸像素为60*60或100*100以上。在规定的图像大小内,算法更容易提升准确率和召回率。图像大小反映在实际应用场景就是人脸离摄像头的距离。

  图像分辨率:越低的图像分辨率越难识别。图像大小综合图像分辨率,直接影响摄像头识别距离。现4K摄像头看清人脸的最远距离是10米,7K摄像头是20米。

  光照环境:过曝或过暗的光照环境都会影响人脸识别效果。可以从摄像头自带的功能补光或滤光平衡光照影响,也可以利用算法模型优化图像光线。

  模糊程度:实际场景主要着力解决运动模糊,人脸相对于摄像头的移动经常会产生运动模糊。部分摄像头有抗模糊的功能,而在成本有限的情况下,考虑通过算法模型优化此问题。

  遮挡程度:五官无遮挡、脸部边缘清晰的图像为最佳。而在实际场景中,很多人脸都会被帽子、眼镜、口罩等遮挡物遮挡,这部分数据需要根据算法要求决定是否留用训练。

  采集角度:人脸相对于摄像头角度为正脸最佳。但实际场景中往往很难抓拍正脸。因此算法模型需训练包含左右侧人脸、上下侧人脸的数据。工业施工上摄像头安置的角度,需满足人脸与摄像头构成的角度在算法识别范围内的要求。

  2.2 人脸检测

  (1)简介

  在图像中准确标定出人脸的位置和大小,并把其中有用的信息挑出来(如直方图特征、颜色特征、模板特征、结构特征及Haar特征等),然后利用信息来达到人脸检测的目的。

  (2)人脸关键点检测(人脸对齐)

  自动估计人脸图片上脸部特征点的坐标。

  (3)主流方法

  基于检测出的特征采用Adaboost学习算法(一种用来分类的方法,它把一些比较弱的分类方法合在一起,组合出新的很强的分类方法)挑选出一些最能代表人脸的矩形特征(弱分类器),按照加权投票的方式将弱分类器构造为一个强分类器,再将训练得到的若干强分类器串联组成一个级联结构的层叠分类器,有效地提高分类器的检测速度。

  最近人脸检测算法模型的流派包括三类及其之间的组合:viola-jones框架(性能一般速度尚可,适合移动端、嵌入式上使用),dpm(速度较慢),cnn(性能不错)。

  2.3 人脸图像预处理

  (1)简介

  基于人脸检测结果,对图像进行处理并最终服务于特征提取的过程。

  (2)原因

  系统获取的原始图像由于受到各种条件的限制和随机干扰,往往不能直接使用,必须在图像处理的早期阶段对它进行灰度矫正、噪声过滤等图像预处理。

  (3)主要预处理过程

  人脸对准(得到人脸位置端正的图像),人脸图像的光线补偿,灰度变换、直方图均衡化、归一化(取得尺寸一致,灰度取值范围相同的标准化人脸图像),几何校正、中值滤波(图片的平滑操作以消除噪声)以及锐化等。

  2.4 人脸特征提取

  (1)简介

  人脸识别系统可使用的特征通常分为视觉特征、像素统计特征、人脸图像变换系数特征、人脸图像代数特征等。人脸特征提取就是针对人脸的某些特征进行的,也称人脸表征,它是对人脸进行特征建模的过程

  (2)人脸特征提取的方法

  基于知识的表征方法(主要包括基于几何特征法和模板匹配法):根据人脸器官的形状描述以及它们之间的距离特性来获得有助于人脸分类的特征数据,其特征分量通常包括特征点间的欧氏距离、曲率、和角度等。人脸由眼睛、鼻子、嘴、下巴等局部构成,对这些局部和他们之间结构关系的几何描述,可作为识别人脸的重要特征,这些特征被称为几何特征。

  基于代数特征或统计学习的表征方法:基于代数特征方法的基本思想是将人脸在空域内的高维描述转化为频域或者其他空间内的低维描述,其表征方法为线性投影表征方法和非线性投影表征方法。基于线性投影的方法主要有主成分分析法或称K-L变化、独立成分分析法和Fisher线性判别分析法。非线性特征提取方法有两个重要的分支:基于核的特征提取技术和以流形学习为主导的特征提取技术。

  2.5 匹配与识别

  提取的人脸特征值数据与数据库中存贮的特征模板进行搜索匹配,通过设定一个阈值,将相似度与这一阈值进行比较,来对人脸的身份信息进行判断。

  3. 人脸识别的主要方法

  3.1 Eigen Face(特征脸)

  MIT实验室的特克(Turk)和潘特(Pentland)提出的“特征脸”方法无疑是这一时期内最负盛名的 人脸识别方法。其后的很多人脸识别技术都或多或少与特征脸有关系,现在特征脸已经与归一化的协相关量(Normalized Correlation)方法一道成为人脸识别的性能测试基准算法。

  人脸识别特征脸算法文档:

  https://blog.csdn.net/zizi7/article/details/52757300

  3.2 Fisher Face(渔夫脸)

  贝尔胡米尔(Belhumeur)等提出的 Fisherface 人脸识别方法是这一时期的另一重要成果。该方法首先采用主成分分析(PCA)对图像表观特征进行降维。在此基础上,采用线性判别分析(LDA)的方法 变换降维后的主成分以期获得“尽量大的类间散度和尽量小的类内散度”。该方法目前仍然是主流的人脸识别方法之一,产生了很多不同的变种,比如零空间法、子空间判别模型、增强判别模型、直接的LDA 判别方法以及近期的一些基于核学习的改进策略。

  Fisher Face算法文档:

  https://blog.csdn.net/zizi7/article/details/52999432

  3.3 EGM(弹性图匹配)

  其基本思想是用一个属性图来描述人脸:属性图的顶点代表面部关键特征点,其属性为相应特征点处 的多分辨率、多方向局部特征——Gabor变换12特征,称为Jet;边的属性则为不同特征点之间的几何 关系。对任意输入人脸图像,弹性图匹配通过一种优化搜索策略来定位预先定义的若干面部关键特征点,同时提取它们的Jet特征,得到输入图像的属性图。最后通过计算其与已知人脸属性图的相似度来完成识别过程。该方法的优点是既保留了面部的全局结构特征,也对人脸的关键局部特征进行了建模。

  弹性图匹配算法文档:

  https://blog.csdn.net/real_myth/article/details/44828219

  3.4 基于几何特征的方法

  几何特征可以是眼、鼻、嘴等的形状和它们之间的几何关系(如相互之间的距离)。这些算法识别速 度快,需要的内存小,但识别率较低。

  3.5 基于神经网络的方法

  神经网络的输入可以是降低分辨率的人脸图像、局部区域的自相关函数、局部纹理的二阶矩等。这类方法同样需要较多的样本进行训练,而在许多应用中,样本数量是很有限的。

  3.6 基于线段Hausdorff 距离(LHD) 的方法

  心理学的研究表明,人类在识别轮廓图(比如漫画)的速度和准确度上丝毫不比识别灰度图差。LHD是基于从人脸灰度图像中提取出来的线段图的,它定义的是两个线段集之间的距离,与众不同的是,LHD并不建立不同线段集之间线段的一一对应关系,因此它更能适应线段图之间的微小变化。实验结果表明,LHD在不同光照条件下和不同姿态情况下都有非常出色的表现,但是它在大表情的情况下识别效果不好。

  3.7 基于支持向量机(SVM) 的方法

  近年来,支持向量机是统计模式识别领域的一个新的热点,它试图使得学习机在经验风险和泛化能力上达到一种妥协,从而提高学习机的性能。支持向量机主要解决的是一个2分类问题,它的基本思想是试图把一个低维的线性不可分的问题转化成一个高维的线性可分的问题。通常的实验结果表明SVM有较好的识别率,但是它需要大量的训练样本(每类300个),这在实际应用中往往是不现实的。而且支持向量机训练时间长,方法实现复杂,该函数的取法没有统一的理论。

声明:凡注明为其它来源的信息均转自其它平台,目的在于传递更多信息,并不代表本站观点及立场和对其真实性负责。若有侵权或异议请联系我们删除。
发表评论
加载中...
  • 弥雅博客 4周前 (09-23)

    人脸识别关键的不是如何应用,相信这也不是过大难题。弥雅认为类似这样的技术最大的难题是数据安全。不是应用安全,是数据安全。若是做不到法律层面的数据安全的话,那么过度的技术应用,就是对人在法律层面权益的一种侵害。

相关文章

切换注册

登录

忘记密码 ?

切换登录

注册