加州大学欧文分校2023年的一项研究得出结论,验证码不仅在实际阻止机器人流量方面无效,而且通过跟踪Cookie引发隐私问题,浪费我们所有人数十亿小时,并为谷歌产生价值近万亿美元的数据。谷歌早在2009年就收购了被广泛使用的reCAPTCHA工具。
这项研究通过GooglereCAPTCHAv2重点研究了现实生活中最常见的两种验证码形式:“隐形”或基于行为的验证码,当你选中“我不是机器人”框时,它会秘密分析你的输入,即使你浏览网站也是如此;还有基于图像的验证码,你需要从谷歌街景拍摄的照片中选择所有摩托车、红绿灯等。这两种验证码对谷歌来说都很有价值。前者生成的跟踪cookie可能有助于定向广告,而后者的数据可用于谷歌内部的人工智能模型训练或出售给其他公司。
谷歌的reCAPTCHAv2没有告诉受试者,而是被添加到该大学内部学生账户系统的账户创建和密码恢复功能中,研究人员测量了完成验证码所需的时间,并在13个月的研究中对3600名用户进行了抽样,以了解他们的体验。不出所料,当涉及到更复杂的图像识别验证码时,用户花费的时间更长,反馈更负面。研究还指出,完成时间取决于学科、经验水平以及是创建还是检索帐户。
研究人员计算了图像和行为验证码的平均完成时间为3.53秒,并将其与2010年至2023年在互联网上完成的5120亿个reCAPTCHAv1和v2验证码的低端估计值相乘,得出了验证码对我们生活影响的以下估计:
完成验证码需要8.19亿小时。
-根据美国联邦最低工资标准,这些时间价值61亿美元。
-消耗134PB的互联网带宽。
--能源消耗750万千瓦时。
-产生750万磅的二氧化碳污染。
我要补充的是:将8.19亿小时与人类平均寿命79岁进行比较,完成验证码需要1182.7人一生。
在这项新的研究中,将人类完成验证码和机器人完成验证码的时间和准确性进行了比较,并参考了之前关于自动化程序破解验证码能力不断增强的研究,研究人员得出结论,机器人现在完成reCAPTCHAv2复选框的速度比人类快,而机器人在图像识别方面花费的时间更多,但准确率更高。研究人员还认为,跟踪Cookie实际上带来了新的安全和隐私风险。根据谷歌发布的标记图像识别数据集的价值,以及单个跟踪Cookie的生命期价值乘以2010至2023年间完成的reCAPTCHAv2估计总量,研究人员对谷歌做出了以下价值估计:
-其完整的reCAPTCHAv2数据集价值87.5亿至323亿美元,理论上可以多次出售给不同的供应商。
-2010年至2023年,reCAPTCHAv2生成的所有跟踪Cookie的生命周期价值为8880亿美元。
研究人员在研究的最后部分表示:“可以得出结论,reCAPTCHAv2的真正目的是为了通过伪装成安全服务的跟踪Cookie代农场来赚钱。”他们认为,由于reCAPTCHA对互联网安全或功能没有实际贡献,因此应该逐步淘汰。然而,这项研究已经进行了两年,短期内仍没有逐步淘汰的迹象。