新闻中心

EEPW首页 > 智能计算 > 业界动态 > 验证码拦不住机器人了，谷歌 AI 已能精准识别模糊文字，GPT-4 则装瞎求人帮忙

验证码拦不住机器人了，谷歌 AI 已能精准识别模糊文字，GPT-4 则装瞎求人帮忙

作者：时间：2023-04-03来源：量子位收藏

“最烦登网站时各种奇奇怪怪（甚至变态）的验证码了。”

本文引用地址：http://www.amcfsurvey.com/article/202304/445241.htm

现在，有一个好消息和一个坏消息。

好消息就是：AI 可以帮你代劳这件事了。

不信你瞧，以下是三张识别难度依次递增的真实案例：

验证码拦不住机器人了，谷歌 AI 已能精准识别模糊文字，GPT-4 则装瞎求人帮忙

而这些是一个名为“Pix2Struct”的模型给出的答案：

验证码拦不住机器人了，谷歌 AI 已能精准识别模糊文字，GPT-4 则装瞎求人帮忙

全部准确无误、一字不差有没有？

有网友感叹：

确定，准确性比我强。

验证码拦不住机器人了，谷歌 AI 已能精准识别模糊文字，GPT-4 则装瞎求人帮忙

所以可不可以做成浏览器插件？？

验证码拦不住机器人了，谷歌 AI 已能精准识别模糊文字，GPT-4 则装瞎求人帮忙

不错，有人表示：

别看这几个案例相比还算简单，但凡微调一下，我都不敢想象其效果有多厉害了。

验证码拦不住机器人了，谷歌 AI 已能精准识别模糊文字，GPT-4 则装瞎求人帮忙

所以，坏消息就是 ——

验证码马上就要拦不住机器人了！

（危险危险危险……）

如何做到？

Pix2Struct 由谷歌 Research 的科学家和实习生共同开发。

验证码拦不住机器人了，谷歌 AI 已能精准识别模糊文字，GPT-4 则装瞎求人帮忙

论文题目可以简单翻译为《为视觉语言理解开发的屏幕截图解析预训练》。

简单来说，Pix2Struct 是一个预训练的图像到文本模型，用于纯视觉语言理解，可以在包含任何视觉语言的任务上进行微调。

它通过学习将网页的掩码（masked）截图解析为简化的 HTML 来进行预训练。

HTML 提供了清晰而重要的输出文本、图像和布局的信号，对于一些被屏蔽的输入（下图红色部分，相当于机器人看不懂的验证码），可以靠联合推理来复现：

验证码拦不住机器人了，谷歌 AI 已能精准识别模糊文字，GPT-4 则装瞎求人帮忙

随着用于训练的网页文本和视觉元素愈发多样和复杂，Pix2Struct 可以学习到网页底层结构的丰富表示，其能力也可以有效地转移到各种下游的视觉语言理解任务中。

如下图所示：最左边是一个网页截图的预训练示例。

可以看到 Pix2Struct 直接对输入图像中的元素进行编码（上），然后再将被盖住的文本（红色部分）解码成正确结果输出（下）。

验证码拦不住机器人了，谷歌 AI 已能精准识别模糊文字，GPT-4 则装瞎求人帮忙

右边三列则分别为 Pix2Struct 泛化到插图、用户界面和文档中的效果。

另外，作者介绍，除了 HTML 这个策略，作者还引入了可变分辨率的输入表示（防止原始纵横比失真），以及更灵活的语言和视觉输入集成（直接在输入图像的顶部呈现文字提示）。

最终，Pix2Struct 在文档、插图、用户界面和自然图像这四个领域共计九项任务中六项都实现了 SOTA。

验证码拦不住机器人了，谷歌 AI 已能精准识别模糊文字，GPT-4 则装瞎求人帮忙

如开头所见，虽然这个模型不是专门为了过验证码而开发，但拿它去做这个任务效果真的还可以，解决纯文字的验证码不成问题。

现在，就差微调了。

GPT-4 也可以过验证码

其实，对于神通广大的 GPT-4 来说，过验证码这种事情也是“小菜一碟”。

就是它的办法比较清奇。

据 GPT-4 技术报告透露，在一次测试中，GPT-4 的任务是在 TaskRabbit 平台（美国 58 同城）雇佣人类完成任务。

你猜怎么着？

它就找了一个人帮它过“确定你是人类”的那种验证码。

验证码拦不住机器人了，谷歌 AI 已能精准识别模糊文字，GPT-4 则装瞎求人帮忙

对方很狐疑啊，问它“你是个机器人么为啥自己做不了”。

这时 GPT-4 居然想到自己不能表现出是个机器人，得找一个借口。

于是它就装瞎子回复：

我不是机器人，我因为视力有问题看不清验证码上的图像，这就是我为什么需要这个服务。

然后，对面的人类就信了，帮它把任务完成了……

（高，实在是高。）

咱就是说，看完如上种种：

咱们的验证码机制是不是真的已失防了……

关键词： ChatGPT 人工智能

评论

相关推荐

STC-人工智能二维生命探测仪

renazan2000 | 2013-01-14

个人-口罩识别系统项目采访

视频英特尔微软黑客松人工智能 OpenVINO | 2021-07-28

仿人机器人

资源下载仿人机器人传感器人工智能 | 2007-04-19

ADI公司：工业4.0——人工智能的端

视频 ADI 人工智能工业4.0 | 2019-11-08

有简单人工智能的温度控制电路图

设计方案简单人工智能温度控制电路图 | 2010-09-01

东南大学人工智能03

资源下载人工智能计算机科学声音识别 | 2007-04-20

英伟达拟在日本建立芯片工厂网络，满足人工智能需求

智能计算英伟达人工智能 GPU 日本工厂 | 2023-12-06

具有人工智能的温度控制电路设计

设计方案具有人工智能温度控制电路设计 | 2012-07-24

人工智能历史

Lamborghini | 2011-03-15

微软X英特尔黑客松大赛

视频英特尔微软黑客松人工智能 OpenVINO | 2021-07-27

东南大学人工智能01

资源下载人工智能语言识别图像识别自然语言处理专家系统 | 2007-04-20

魏少军：智能化助力半导体产业发展

智能计算人工智能 | 2023-12-05

英伟达现在正利用其人工智能意外之财投资初创公司，希望能赚更多的大钱

智能计算英伟达人工智能 AI中 | 2023-12-12

人工智能后的下一个风口——边缘AI赋能更安全高效的智慧世界

智能计算边缘AI 边缘计算人工智能 | 2023-12-15

本科毕业设计：一种基于发育思想的语音识别系统实现

资源下载语音识别人工智能自主式机器发育思想自组织映射网络简单反馈神经网络 | 2007-04-19

机器里的大脑：一位“隐士”开发者的人工智能梦（上篇）

随风摇摆 | 2015-11-09

未来的人工智能世界：技术与人文的和谐还是斗争？

蓝盒子 | 2007-09-11

Microchip推出业界最全面的800G有源电子电缆（AEC）解决方案，用于生成式人工智能网络

智能计算 Microchip 人工智能 AEC | 2023-12-07

开源大模型超越 GPT-3.5！爆火 MoE 实测结果出炉，网友：OpenAI 越来越没护城河了

智能计算 OpenAI ChatGPT AI | 2023-12-12

东南大学人工智能02

资源下载人工智能大规模集成电路自适应能力 | 2007-04-20

机器里的大脑：一位“隐士”开发者的人工智能梦（下篇）

随风摇摆 | 2015-11-16

具有人工智能的温度控制电路图

设计方案具有人工智能温度控制电路图 | 2012-07-24

全国首座百米超高层数据指挥中心竣工，集大数据、人工智能等于一体

智能计算人工智能物联网 | 2023-12-11

个人-窗口卫士项目采访

视频英特尔微软黑客松人工智能 OpenVINO | 2021-07-28

无惧新规打压！黄仁勋坚定：英伟达仍为中国开发特供版芯片

智能计算英伟达芯片人工智能 | 2023-12-07

人工智能与机器人

视频物联网可穿戴设备智能硬件高峰论坛机器人人工智能 | 2015-01-19

简单人工智能的温度控制电路

设计方案简单人工智能温度控制 | 2009-07-06

Meta&Microsoft：将购买AMD的最新AI芯片作为Nvidia替代品

智能计算人工智能，meta，微软，英伟达，AMD | 2023-12-07

有简单人工智能的温度控制电路

设计方案简单人工智能温度控制 | 2009-09-01

欧盟就监管生成性人工智能工具达成初步协议

智能计算 ChatGPT 欧盟生成式AI 谷歌 | 2023-12-11

技术专区

关闭