2021年机器在多领域占优,面部识别真超人类大脑?

为了帮助回答有关“人类或机器谁更擅长识别同卵双胞胎”的问题,我决定设计一个比指纹读取器稍微复杂的实验,并邀请我的“小科学家们”(我的儿子)接受培训以提供帮助。的头像,然后用这些照片训练面部识别机器学习系统(一张正面,一张向左,另一张向右)。


来源:学术头条

本文约4512字,建议阅读8分钟
本文介绍了外国程序员使用软件利用AI系统Raspberry Pi识别双胞胎儿子的实验,并试图探究在面部识别方面,机器的发展是否已经超过人类大脑。

到2021年,人​​们通常认为,通过学习算法和人工智能研究,机器在许多方面都优于人类。很长一段时间以来,机器一直在制造和供应链领域中占据主导地位,甚至开始从事更复杂的任务,例如自动驾驶,甚至撰写困难的综合文章。但是,就面部识别而言,机器的开发真的超过了人脑吗?

当我同一的双胞胎儿子在13年前出生时,我和妻子很容易认识到哪个是尼古拉斯,哪个是亚历山大。在旧金山加利福尼亚太平洋医疗中心的新生儿重症监护病房(NICU)与他们在一起8周后,我们知道如何将他们的个人行为与他们的名字相匹配。我们很早就了解了最同一的双胞胎父母会掌握的内容:一个人不仅取决于他的外表,而且还取决于他走路,谈话和与世界互动时所表现的各种行为的差异。处理这个广泛的数据集使人类可以立即识别我们认识的人,包括相同的双胞胎。

2021年机器在多领域占优,面部识别真超人类大脑?

图片|亚历山大和尼古拉斯

通过广泛使用从识别罪犯到帮助我们购物的所有事物,新闻中被称为“矩阵般的银弹”,我一直想知道当数据集仅显示很小的差异时,机器可以在识别其他人的面孔时能做到什么?例如,识别相同的双胞胎。

讨论深度差异

随着儿子每天长大,我们详细讨论了他们的遗传构成的独特性质 – 实际上,他们是从同一受精卵中克隆的(注意:有一个非常频繁的“凉爽”因素,因为它们是星球大战中克隆人的忠实粉丝)。对他们来说,他们是完全相同的人,是由同一蓝图创建的。当然,它们之间存在差异,这使我偶尔会混淆它们,我想机器将无法告诉他们。相同的DNA是一回事,但是基因的内在表现以及它们所生活的环境的影响在随着时间的流逝的人类的变化和发展中起着重要作用。

例如,我最近用指纹读取器购买了一部手机,我问我的儿子是否想做一个小实验:一个将指纹放入,另一个用自己的手指解锁,这显然不起作用。事实证明,多个环境因素(其中仅是一个基因)驱动子宫中“指纹”的形成,因此双胞胎通常具有不同的指纹。

为了帮助回答“谁更好地识别人类或机器的双胞胎”的问题,我决定设计一个比指纹读取器要复杂得多的实验,并邀请我的“小科学家”(我的儿子)培训帮助。

施工实验

对于这个项目,我想构建一个便宜的计算机系统,该系统能够运行执行和培训机器学习和面部识别模型所需的所有软件。我之所以选择Raspberry Pi,是因为它非常具有成本效益,其外围支持和运行标准Linux发行版的能力以及编译软件所需的所有工具。

我现在已经有一些其他项目的覆盆子Pi,所以我测试了三个,以查看哪个最适合该应用程序。 Zero工作正常,但是要分析视频提要的框架并编译所有必需的软件(是的,编译软件需要2天)需要48小时。对于想要运行类似环境的任何人,我强烈建议使用PI 4B(8GB型号),因为它具有更快的处理器,多个内核和扩展的内存。我们测试的三个PI的详细细节和形状因子如下所示。该设置过程的其余部分假设使用PI 4B(8GB)。

2021年机器在多领域占优,面部识别真超人类大脑?

2021年机器在多领域占优,面部识别真超人类大脑?

图| Pi Zero,Pi 3b+和Pi 4B-尺度铅笔

该项目还需要一个网络摄像头。我已经有一个Logitech USB网络摄像头,它可以很好地工作,而无需安装驱动程序。任何现代的Logitech或类似网络摄像头都可以使用。

设置:步骤1

设置PI的第一步是将Raspberry Pi OS刷到Micro SD卡并进行一些基本配置。为此,请下载并将Raspberry Pi成像器安装到工作站上。安装完成后,插入Micro SD卡(通常使用适配器),启动成像器,选择操作系统和SD卡,然后选择“写”。对于OS(操作系统),选择Raspberry Pi OS(32位),这是Debian Linux的端口,其所有元素都需要设置机器学习环境。写入和验证SD卡后,请勿将其删除。在将其重新插入PI之前,需要三个其他配置:设置WiFi,SSH和视频输出。

2021年机器在多领域占优,面部识别真超人类大脑?

现在弹出Micro SD卡,将其插入PI,连接到电源并打开。大约一分钟后,PI应完全启动,并应连接到您的WiFi网络。检查WiFi路由器以获取PI的IP地址。

现在,验证您可以通过打开终端(在Mac上)或使用Putty(在Windows上)和IP地址作为用户名“ Pi”(默认密码为“ Raspberry”)来验证您可以连接到PI。

设置:步骤2

安装过程的第二步是安装和编译所有必要的软件。为了执行面部识别任务,我决定使用OpenCV(开源计算机视觉库)和DLIB。 OpenCV和DLIB具有许多优化算法,包括面部识别,已广泛用于行业和学术界,受到尊重和支持,并且具有用于驱动模型培训和识别计划的Python编程语言的接口。 Internet上有许多示例用于在Raspberry Pi上设置OpenCV和DLIB,但是我找不到任何简洁而全面的内容,因此我创建了一个简单的包装器来安装所有必要的软件并编译OpenCV和DLIB源代码。下载并执行此包装器:

设置:步骤3

PI现在准备拍摄照片并训练面部识别模型。为此,我们需要查看PI上的窗口环境,以通过VNC查看器连接到它。您需要在PI上启用VNC服务器并在工作站上下载客户端。请按照以下步骤操作:

执行面部识别

面部识别过程涉及3个步骤:拍照,训练模型,然后分析实时视频。所有3个任务都可以使用Face -Req.py Python程序执行,该程序已从上面的GitHub存储库中弹出(注意:这是第一个修订版,并且没有很多错误处理功能 – 如果您希望我们改进它,请提交PR)。拍摄照片,火车模型和分析视频的步骤如下。这三个假设您已经通过VNC登录到PI并打开了一个终端窗口。

实验结果

完全设置环境后,我为自己拍了3张照片,3张尼古拉斯的照片和3张亚历山大的照片,然后使用这些照片来训练面部识别机学习系统(一个前部,一张向左,另一个向右)。在进行这些测试的那天,除了当前照片以外,没有对任何照片进行更正。训练系统后,我们轮流站在相机前,确定机器是否可以识别它。

注意:我们尝试了另一个实验,以不同的角度拍摄10张照片,但这并没有改变结果,这可能是因为我们使用的是一种面部识别方法,该方法面向梯度直方图(HOGS),该方法仅适用于额叶照片。

结果:测试1

测试1是我自己和亚历山大,机器识别是正确的。

2021年机器在多领域占优,面部识别真超人类大脑?

结果:测试2

测试2是尼古拉斯和我。机器再次正确识别了它。我开始认为我最初的猜测是错误的 – 也许机器会赢。

2021年机器在多领域占优,面部识别真超人类大脑?

结果:测试3

测试3是这次的“亮点” – 我们三个人在一起。然后机器出现故障!显然,没有两个尼古拉斯。我们发现,如果孩子们四处走动,识别会来回切换,但是机器很少同时识别双胞胎。不科学的时间约5%,它同时正确地识别了双胞胎和我自己。

2021年机器在多领域占优,面部识别真超人类大脑?

结果:测试4

我想看看机器学习模型如何识别3岁儿童双胞胎的照片 – 照片放在相机前。我不得不给这台计算机一些肯定,它确实正确地识别了照片中的尼古拉斯(尽管没有认可亚历山大),但我将照片的方向和距离移到了镜头上,然后错误地识别出亚历山大,没有识别尼科拉斯。但是,这是一个很好的结果,毕竟从3-10岁开始,儿童的面孔发生了很大变化。

2021年机器在多领域占优,面部识别真超人类大脑?

亚历山大(左),尼古拉斯(右)

2021年机器在多领域占优,面部识别真超人类大脑?

亚历山大(左),尼古拉斯(右)

结果:测试5

我尝试了一张更新的彩色照片(孩子可能已经4岁),机器再次出现故障。它错误地识别了两个尼古拉斯。

2021年机器在多领域占优,面部识别真超人类大脑?

对于最终测试,我想看看这些照片的年龄限制应在完全无法识别的机器之前。我用一张大约一岁的双胞胎的照片。机器正确地确定了我,但是未识别双胞胎。

注意:即使是一张12岁的静照片,我和我的妻子很容易立即告诉双胞胎。

2021年机器在多领域占优,面部识别真超人类大脑?

实验结论

这里的第一个结论很明显。一个人可以花75美元来构建一个功能齐全的计算机系统,该系统可以运行现代面部识别和机器学习算法(如果您不介意慢一点,有些甚至只有10美元)。更不用说识别双胞胎的更复杂的任务是,该机器在实时视频中识别非双线的成功率是100%。在此系统中训练有素的每个非双线都会获得100%的识别成功率(我们进行了其他非双线测试,此处未显示)。同时,出于个人隐私问题,这确实使我犹豫了。这项技术是强大的,非常易于使用,并且很可能会在我们日常生活中无法预测的地方部署 – 我们需要确保不会滥用这项技术。

第二个结论是,在我们生命的头13年中,我们的面部特征继续发生巨大变化,这使得对年轻人的面部识别困难。该机器能够从旧照片中识别双胞胎,即使它们仍然是“幼儿”,我也给我留下了深刻的印象。老实说,这太棒了!没有人可以看我们孩子的旧照片,并确定除我和我的妻子以外的谁是谁。

最后,最重要的是,我观察到机器难以识别相同的双胞胎,甚至是我的孩子等有明显差异的双胞胎。该系统确实很难识别,尤其是当一对双胞胎或一个在视频框架内移动时 – 通常带有标识错误。从这些简单的测试中,我们得出结论,人类在面部识别方面比现在要好得多。这并不奇怪,因为600万年,我们一直在发展并完善我们的感官。我无法告诉你为什么我可以轻松地分辨孩子之间的区别,我只知道这很容易。该机器最终可能会赶上我们,但现在不赶上我们。

下一个计划

我的儿子们想在PI中内置一些其他功能,以控制门上的锁,或者当他们进入卧室时打招呼,但根据我们的结果,我们首先需要提高PI区分区分的能力(因此一个派对不会碰到另一方的宝藏)。

为了提高系统的准确性,我想尝试不同的面部识别技术,例如利用DLIB支持的启用DLIB的卷积神经网络(CNN)(尽管Raspberry Pi受计算能力的限制),或者在GCP,AWS,AWS,AZURE或AZURE中具有PI Call Public Services,以识别面对面的PI呼叫公共服务。

关于学者双胞胎面部识别的研究也越来越多,因此技术肯定会继续改进,以解决我们在这里指出的一些现有缺陷 – 我的儿子和我一定会专注于这一领域。

原始链接:

– 结尾-

2021年机器在多领域占优,面部识别真超人类大脑?

单片机

基于单片机的交通灯控制电路设计与实现相关内容分享

2025-5-5 18:00:44

单片机

基于89C52单片机的交通灯双模式控制软硬件设计与实现

2025-5-5 18:59:50

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索