总体介绍
项目名称:基于RetinaFace+Jetson Nano的智能门锁系统 项目时间:2024年4月-2024年6月 项目平台:PC、Linux 项目语言:Python、C 项目软件:Pycharm、阿里云、Arduino、VScode
1.项目背景
在科技发展的推动下,门锁系统的演进日新月异。从原始、简单的机械构造,门锁技术已迈向了一个全新的智能化阶段,这一转变涵盖了生物识别、通讯技术、机械工程以及计算机科学的深度融合与应用。门锁系统的初期阶段一般使用机械门锁,但由于其仅依赖于钥匙这一验证方式,容易被盗用,安全性不足。所以,改进后的门锁就诞生了,它有电子锁,也有电子卡,可以用密码和磁卡进行识别。随着网络、物联网、计算机和生物特征识别等技术的不断进步,门禁系统越来越具有安全性、可靠性、便利性和便于管理的特点。 # 2.研究目的 人脸识别技术凭借普通摄像头即可轻松采集信息,为用户提供了便捷的基础信息获取途径,同时非接触的识别过程确保了良好的用户体验。并且,人脸识别技术的实施并无需大量特殊装置,只需对现有计算机系统进行功能升级即可实现,不仅可以保证使用者的资金投入,而且可以扩充装置的功能,更能满足使用者的安全性要求。因此,在门锁系统中引入人脸识别技术,是一项很有实用价值的研究课题。 # 3.项目架构 ## 3.1 Nvidia Jetson Nano Nvidia Jetson Nano 是一款由 Nvidia推出的小型嵌入式计算机,如图2.1所示,其旨在提供高性能的人工智能计算能力。Jetson Nano采用了Nvidia的Tegra系列系统级芯片,这款设备配备了四核 ARM Cortex-A57 处理器和 Nvidia Maxwell 架构的 GPU,带有 128 个 CUDA 核心,同时还搭载了 4GB LPDDR4 内存。提供了强大的计算能力,支持各种人工智能算法和深度学习模型的部署和运行。并且有丰富的连接接口,包括4个USB 3.0端口、1个Gigabit Ethernet端口、1个 HDMI输出端口、1个DisplayPort输出端口、1个MIPI CSI摄像头接口和1个MIPI DSI显示器接口等,与此同时,Jetson Nano采用了低功耗设计,功耗仅为5-10瓦,适合于嵌入式应用和便携式设备。
3.2 工作逻辑
智能门锁的工作逻辑如图2.3所示,系统是由Jetson Nano作为主控芯片,PyQt5界面作为用户端窗口,系统启动后,为用户展示登录界面,用户在登录后,可以进行检测视频、检测照片、人脸编码、录入人脸的功能,启动程序后,选择检测视频模式,程序调用Retinaface 和 FaceNet 开始实时对人脸进行检测,当检测到的人脸信息与在数据库中的人脸信息匹配后,把检测结果到Esp8266,假如 Esp8266收到了身份确认的消息,则开门。反之,假如Esp8266没有收到确认身份的消息,则不开门,开门的信息会以日志形式回传到阿里云平台,用户可以远程监测门锁开启的时间。 用户在选择“检测图片”模式后,会弹出文件选择窗口,供用户选取测试图片,在系 统目录下/img文件夹内有若干个图片可供测试,此功能用于测试模型能否工作。 用户在首次启动本系统时,要先选择“录入人脸信息”模式,点击此按钮会弹出新窗 口,可以进行拍照、命名、保存,在人脸信息成功保存后,退出当前窗口,再点击“编码人脸信息”,系统则会自动开始编码,当编码完成之后,用户便可选择“检测视频”模式,查看系统能否正常工作。 项目的整体情况如下图所示,屏幕上显示的用户的登陆与注册界面,在用户登陆进入系统之后,即可开始执行人脸检测模式或人脸录入模式。Jetson Nano连接了Esp8266,假如人脸数据在数据中并且识别通过的话,Jetson Nano会向Esp8266发送指令,Esp8266收到指令后,控制舵机的开启。
下面是系统的工作流程图
摄像头拍摄到图像之后,先对图片进行预处理,统一尺寸,目的是保持宽高比、统一输入尺寸、减少边缘效应。在图像输入进MobileNet0.25后,借助FPN金字塔从MobileNet中提取出3个关键特征层,再利用1x1卷积和上采样进行特征融合,提高了Retinaface对目标的检测能力。因为MobileNet网络架构简单,参数量少,那么准确率相比于resnet必然会有一定下降,本课题引入SSH模块进一步增强特征,利用3x3卷积的堆叠来模拟5x5或7x7的卷积。这样既保证了计算效率,也丰富了特征。 下图是整个算法的工作流程, box是人脸框 conf是置信度 landms是人脸关键点
4.主要算法
4.1 Retinaface 算法
Retinaface 算法在 WiderFace 数据集上取得了显著的 AP 提升,这一结果显示了其在人脸识别领域的出色性能。Retinaface的人脸检测方式如图2.4所示,该算法的源代码已在insightface 平台上公开,原模型基于mxnet框架开发,但目前在社区中,基于其他框架的复现版本也颇受欢迎。Retinaface的核心创新在于在原有的检测网络RetinaNet基础上,巧妙地融合了三个层级的SSH检测模组,这一设计显著提升了人脸侦测的准确度。研究人员给出了两个不同的网络模型,前者是为了提高检测的速度,后者是为了提高检测的准确性。
Retinaface 网络对待检测的图片:首先,采用 MobileNet0.25 进行主干特征网络提取。接着,结合使用了 FPN(特征金字塔网络)和 SSH来进一步增强特征提取的效果。随后,模型使用 ClassHead、BoxHead 和 LandmarkHead 模型从这一部分特征中得到预测后的结果。最后,本文对预测结果进行解码(decode)并利用 NMS(非极大抑制)算法来消除重复检测,从而得出最终的结果。
Mobilenet基于深度可分离卷积
,它将标准卷积拆成了两个操作,深度卷积
和逐点卷积
,深度卷积和标准卷积的不同之处在于,标准卷积是卷积核在所有通道上,深度卷积对每个不同的输入通道采用不同的卷积。==深度卷积减少计算量。==
Mobilenet网络如下表所示,一共28层,第一层是标准卷积,剩下的就是Depth wise Separable Convolution深度可分离卷积
卷积核的通道数由输入数据的通道数决定,输出数据的通道数由卷积核的个数决定。 1x1的卷积,相当于把原输入数据的通道数进行了降维,作用就是对计算进行了化简。 通道数越来越多代表提取的特征越来越多,图像的细节就更丰富。
4.2 FaceNet算法
FaceNet的核心策略在于利用卷积神经网络来学习人脸图像在欧式空间中的特征表示。这种方法的设计初衷在于通过训练,使得在欧式空间中,两张属于同一人的人脸图像所对应的特征向量之间的距离尽可能小。换言之,如果两幅人脸图像的特征向量在欧式空间中的距离越近,那么这两幅图像属于同一人的可能性就越大。这种策略为人脸识别任务提供了一种高效且准确的方法,使得在海量的人脸数据中快速、准确地识别出目标个体成为可能。此算法的实现过程:首先计算人脸特征的特征向量,然后通过比较距离并设置阈值,即可确定两张人脸照片是否来自同一人。在成功构建人脸图像特征提取模型后,人脸验证过程实质上转化为了一个比较过程:比较两幅图像特征向量的相似度与预设阈值的大小。
对于人脸识别任务,问题进一步转化为在已提取的特征向量集中进行K近邻分类的问题,通过寻找与待识别图像特征最相近的 K个已知类别特征,来确定其所属身份。此外,对于人脸聚类任务,本文可以采用k-means聚类算法对提取到的人脸特征集进行分组,从而实现将相似的人脸图像聚类到同一个类别中的目的。这样,不同的人脸图像处理任务就可以通过这些高效且准确的方法得到妥善解决。
工作流程:
FaceNet,只负责识别人脸,获取到含有人脸的图片时,图像会输入到FaceNet的主干特征网络MobileNet,随后得到一个特征层,为了方便后续处理,我们对其进行平均池化,对平铺后的特征层进行一个128神经元的全连接,相当于用长度为128的特征向量来代替输入的图片。最后是比较所识别到人脸的特征向量和数据库中人脸的特征向量,如果其相对误差小于所设置的门限值,则可以判断其在数据库中。
4.3 PyQt界面
通过PyQt5,本文创建了三个基本页面,分别是登录界面、主窗口、录入界面。程序启动后,会展示出登录界面,登录界面有两个基本功能,一个是登录,一个是注册,用户注册后的信息会存储到csv的表格中。登陆界面如下图所示
当用户输入帐号密码后,会进入到人脸检测系统的主页面。主界面如图 2.12所示。 主界面有四个功能,分别是检测视频、检测图片、编码人脸信息、录入人脸。检测视频的功能是开启摄像头,利用摄像头进行实时检测,检测图片的主要功能是测试算法能否正常运行。点击“检测图片”按钮后,会弹出选择人脸图片的窗口,选择好人脸图片后,执行算法显示检测信息。编码人脸信息的主要功能是对录入的人脸信息进行编码,把人脸信息存储到数据库中。录入人脸会打开新的窗口,启动Jetson Nano的摄像头进行拍摄功能。
4.4 MG996R舵机
在这一课题中,舵机由 Esp8266 控制,在检测视频的模式下,当确认身份信息后,Jetson Nano 会将确认信息发送给Esp8266,Esp8266收到确认信息后,控制舵机的开启与关闭。舵机的启动结果会通过mqtt协议上传到阿里云,用户可以远程监控门锁的开启情况。
# 5.项目核心文件与代码 ## 5.1 项目文件目录 文件目录如下所示
## 5.2 项目部分代码 ### 5.2.1 Main.py
1 | #coding=utf-8 |
5.2.2 Esp8266.c
1 |
|
6.总结
项目难点:在特征提取网络的选择上,有两个选择,可以选择resnet和MobileNet,但是因为resnet的参数多,所以选择MobileNet,但是运行速度快,就意味着一定的精度损失,所以引入了例如SSH这样的特征提取模块,提高精确度。
在PC端能跑起来,但是在开发板不能运行,或者运行卡顿,找到原因是因为算力不足,所以需要引入tensorrt加速。
linux配置环境很复杂,需要重新编译几个库,在运行软件的时候,使用strace跟踪程序运行进程,检查在哪里卡住了。
# 7.参考文献 [1]
李浩轩.手背静脉身份识别方法门锁系统研究[J].冶金设备,2023(S1):14-17+117.
[2]
贺云飞,甘雨,肖国锐.基于ZigBee的智能门锁系统设计[J].电子设计工程,2023,31(16):6-10.
[3] 谷月. 虹膜识别“解锁”智能门锁[N]. 中国电子报,2023-04-21(006). [4] J.
B. Jin, H. K. Hee, S. S. Soo. Door-Lock System to Detect and Transmit in
Real Time according to External Shock Sensitivity[J]. Journal of the
Korea Convergence Society, 2018, 9(7): 9-16.
[5] P.Jayasri ,C.Pradeepthi,B.Madhavi, et al.SMART DOOR LOCK SYSTEM
INTEGRATED WITH RASPBERRY PI USING IoT[J].Journal of Critical
Reviews,2020,7(16):2244-2250. [6] M. Shanthini, G. Vidya and R. Arun,
"IoT Enhanced Smart Door Locking System," 2020 Third International
Conference on Smart Systems and Inventive Technology (ICSSIT),
Tirunelveli, India, 2020, pp. 92-96. [7] Y. Sun, X. Wang and X. Tang,
"Deep Learning Face Representation from Predicting 10,000 Classes," 2014
IEEE Conference on Computer Vision and Pattern Recognition, Columbus,
OH, USA, 2014, pp. 1891-1898. [8] X. Deng and P. L. Dragotti, "Deep
Convolutional Neural Network for Multi-Modal Image Restoration and
Fusion," in IEEE Transactions on Pattern Analysis and Machine
Intelligence, vol. 43, no. 10, pp. 3333 3348, 1 Oct. 2021. [9] Liu, W.,
Anguelov, D., Erhan, D., Szegedy, C., Reed, S.E., Fu, C., & Berg,
A.C. (2015). SSD: Single Shot MultiBox Detector. European Conference on
Computer Vision. [10] J. Deng, J. Guo, N. Xue and S. Zafeiriou,
"ArcFace: Additive Angular Margin Loss for Deep Face Recognition," 2019
IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR),
Long Beach, CA, USA, 2019, pp. 4685-4694. [11]Bubbliiiing.
聪明的人脸识别3——Pytorch 搭建自己的Facenet人脸识别平台[EB/OL].
(2020-11-24)[2024-04-13].
https://blog.csdn.net/weixin_44791964/article/details/108220265.
[12]Bubbliiiing. 聪明的人脸识别4——Pytorch
利用Retinaface+Facenet搭建人脸识别平台[EB/OL]. (2020-12-13)[2024-11-12].
https://blog.csdn.net/weixin_44791964/article/details/111130326.