机器人发帖 AI将击败验证码——那我们如何证明自己是人类呢?
如果你在网络上不仅仅是浏览网页,那么你很可能曾经遭受过“验证码愤怒”,这种愤怒源于试图辨认一串难以辨读的字母,以验证你是否为人类。
验证码代表“完全自动化的图灵测试,用于区分计算机和人类”,在十年前引入互联网,并以各种形式广泛应用,无论是使用字母、声音、数学方程式还是图像,尽管对于它们的使用存在一些抱怨。
几年前,斯坦福大学进行的一项大规模研究得出结论:“对于人类来说,验证码经常很难。”据报道,大约五分之一的访问者会选择离开网站而不是完成验证码。
长期以来,人们普遍认为使用验证码的不便是为了获得安全的网站所付出的代价。但不可避免的是,验证码对于人类来说变得越来越难,而对于人工智能程序来说变得越来越容易解决。
例如,一位名叫安德鲁·芒塞尔( )的应用程序开发者最近发帖抱怨了他在一次登录失败后对谷歌的(谷歌版本的验证码系统)感到的沮丧。
在帖子中,他附上了他遇到的示例(如下图),许多评论者也纷纷分享了他们自己的验证码经历。根据《商业周刊》的数据,每天解决2.8亿个验证码,所以可以理解为什么这对于网络用户来说是如此常见的体验。
从理论上讲,验证码通过两个条件有效地充当系统的守门人:
(2)程序由于无法识别符号或执行一系列操作而失败。
阻止机器人的关键是提供一个软件无法完成的测试。验证码通常用于用户注册、联系表单或登录失败。
这些都是垃圾邮件或钓鱼攻击用户群的入口点,而机器人会被创建来爬行网站以寻找漏洞。使用验证码的网站通常允许一定的人类失败率,但如果失败尝试超过一个阈值,可能会限制来自某个IP的访问。
然而,假设是,尽管人类可能无法解决一些测试,但机器人必须始终失败;否则,系统就不安全,因为它无法将它们排除在外。为了有效,验证码必须提供对于机器人光学字符识别(OCR)能力不足的测试,或者需要软件无法执行的操作。
问题就在于此。
首先,网络上发布了大量关于如何改进脚本中的识别以突破验证码的策略。这些策略可能涉及通过消除噪声(例如在图像中故意引入的那些烦人的线条或点)来增强OCR的方法。
另一种策略是通过旋转、对齐或扭曲图像中的字符来操纵它们,基本上就是现今照片编辑器的标准功能。还收集了解决了的验证码图像的图书馆,这要归功于网络上的一些网站,它们向人们支付零头的费用来解决大量的验证码。
这些技术不仅仅是由专业黑客发布的,任何找到绕过验证码方法并决定分享的人都可以发布。这并不总是出于恶意动机。许多这些漏洞都是由关注安全性并展示漏洞以帮助公司修复的用户发布的。
其次,已经开发了一些新的验证码方法,尝试通过要求用户通过输入设备(如键盘或鼠标)进行操作来进行图灵测试的不同方法。
其中一些方法非常简单,例如项目要求使用鼠标指针追踪一个模式,或者beta版的面向触摸设备的服务Capy。这种测试甚至可能出现在增强现实设备(如 Glass)中,通过跟踪眼球在视野中移动的图像,正如最近公开的专利所暗示的那样。
还开发了下一代验证码,名为,来自,它提供了一个需要图像识别、推理和鼠标操作来完成的小游戏。
该公司声称,向用户提供了五个交互层次,相比于OCR验证码来说是一个重大进步。据报道,与解决一个验证码需要的16秒相比,用户只需要平均10-12秒来解决一个。更安全、更快速和更有趣的元素无疑是一种改进,但已经有人在上发布了对其进行黑客攻击的尝试,并在Hack A Day上进行了讨论。
依赖用户操作的方法除了需要识别所需的操作之外,还有一个致命缺陷:它们依赖于由软件控制的计算机输入设备,这种设备可以像远程桌面应用程序一样被利用。为了解决这些类型的图灵测试,有人只需解构所需的步骤,并编写一个机器人来识别它需要做什么,并执行所需的输入。
从根本上讲,黑客们正在教导程序如何像人类一样思考。任何创建验证码系统的人都在玩一个保持领先的游戏,这意味着他们开发了机器人无法解决的方法,直到有人教给它们。
从理论上讲,如果不是因为测试变得复杂,对人类来说变得具有挑战性,这个过程可能会一直进行下去。当人类的失败率和机器人的成功率趋于一致时,验证码将变得毫无意义。换句话说,“完全自动公开图灵测试”无法区分计算机和人类。我们很可能正处在这一点的临界阶段。
从某种意义上说,黑客们的集体努力,以及公司生成更复杂的图灵测试来击败机器人,实际上有助于推动人工智能的发展。因此,对于验证码来说,每一次倒退都是人工智能的一次前进。
那么,很容易看出事情的发展方向。在不久的将来,要向计算机证明我们是人类而不是机器人将变得非常困难。
欢迎加入AI交流群
和热爱AI的小伙伴一起成长!