谷歌 Transformer 八子全部「出逃」，他们创作了 ChatGPT 中的「T」

作者：时间：2023-07-17来源：半导体产业纵横收藏

谷歌人工智能领域最有影响力的论文之一《Attention Is All You Need》的共同作者之一的人工智能研究员 Llion Jones 证实，他将于本月晚些时候离开谷歌日本公司并计划在休假后创办一家公司。

本文引用地址：http://www.amcfsurvey.com/article/202307/448679.htm

Llion Jones 对媒体表示："离开谷歌并不是一个容易的决定，与谷歌一起度过了美妙的十年，但现在是时候尝试一些不同的东西了。考虑到人工智能的发展势头和进展，我觉得现在也是建立新公司的好时机"。

自 2017 年出版以来，《Attention Is All You Need》轰动硅谷。该论文介绍了 Transformer 的概念，这种系统可以帮助人工智能模型将其正在分析的数据中最重要的信息归零。Transformer 现在是大型语言模型的关键构建块，该技术是 OpenAI 的 ChatGPT 等流行人工智能产品的基础。

随着 Llion Jones 的离开，这篇论文所有八位作者都已离开谷歌。

人们也许不认识他们的脸，或者没听过他的名字，但只需要 5 秒钟，就可以介绍他们的身份——「他们创作了 ChatGPT 中的「T」。

来源：PitchBook

谷歌为何失去「Transformer 八子」

Transfomer 是谷歌最重要的发明之一，它最初是在午餐时设计出来的。2017 年，Alphabet 公司加利福尼亚山景城总部的研究人员在中午用餐时谈论如何让计算机更高效地生成文本。在接下来的 5 个月里，他们进行了实验，并在没有意识到他们所发现的问题的重要性的情况下，将他们的发现写成了一篇名为《Attention is All You Need》的研究论文。

随后，他们带来了人工智能的飞跃。

这篇论文的八位作者创建了 Transformer 系统，使机器能够比以往任何时候都更高效地生成类似人类的文本、图像、DNA 序列和许多其他类型的数据。他们的论文最终被其他研究人员引用了 8 万多次，他们设计的人工智能架构为 OpenAI 的 ChatGPT（"T "代表 Transformer）、Midjourney 等图像生成工具提供了基础。

谷歌与全世界分享了这一发现，科技公司经常开源新技术，以获得反馈、吸引人才和建立支持者社区。

但谷歌本身并没有立即使用这项新技术。在谷歌努力将其尖端研究成果转化为可用服务的过程中，该系统处于相对休眠状态长达数年之久。但另一家公司 OpenAI，它利用了谷歌的发明，对这家搜索巨头发起了多年来最严重的威胁。

谷歌哪里出了问题？

一个明显的问题是规模。根据人工智能公司 Glass.ai 的估计，谷歌拥有一支由 7,133 名员工组成的队伍，而其员工总数约为 140,000 人。Glass.ai 今年早些时候扫描了 LinkedIn 的个人资料，以识别大型科技公司的人工智能员工。相比之下，OpenAI 引发了一场 AI 军备竞赛，其员工规模要小得多——到 2023 年，大约 375 名员工中约有 150 名 AI 研究人员。

谷歌的庞大规模意味着科学家和工程师在创建 Transformer 时必须经过多层管理才能批准想法。谷歌智库（该公司主要人工智能部门之一）的研究人员也缺乏明确的战略方向，导致许多人沉迷于职业发展和研究论文的知名度。

另一个问题在于，将创意转化为新产品的门槛也非常高。25 岁的伊利亚·波洛苏欣 (Illia Polosukhin) 第一次与研究员同事阿什什·瓦斯瓦尼 (Ashish Vaswani) 和雅各布·乌兹科雷特 (Jakob Uszkoreit) 在谷歌食堂坐下来时说道，「除非（一个想法）能成为一项价值十亿美元的业务，否则谷歌不会采取行动。」但建立一个价值十亿美元的业务需要不断的迭代和面对大量问题，这是谷歌并不总是容忍的。

谷歌的一位女发言人表示，该公司 "为我们在 Transformer 的行业定义性、突破性工作感到自豪，并为它所创造的人工智能生态系统而感到振奋，包括让我们的研究员在谷歌公司外推进他们的研究与其他人合作并且发现新机会。"

德语流利的 Uszkoreit 注意到，这项新技术可以比谷歌翻译更准确地将英语翻译成德语。但谷歌本身花了很长时间才将该技术应用到其免费翻译工具或其语言模型 BERT 中，而且该公司从未将其部署在任何人都可以测试的聊天机器人中。也就是说，直到 2022 年底 ChatGPT 的推出才迫使谷歌在 2023 年 3 月迅速发布了 Bard。

多年来，这些研究员们见证了他们的想法被其他人应用到一系列任务中，从 OpenAI 的 ChatGPT 早期迭代到 DALL-E，从 Midjourney 的图像工具到 DeepMind 的蛋白质折叠系统 AlphaFold。很难不注意到最令人兴奋的创新发生在山景城之外。

在某种程度上，谷歌成为了自身成功的受害者。它的队伍中有像 Geoffrey Hinton 这样的传奇人工智能科学家，并且在 2017 年就已经在使用尖端的人工智能技术来处理文本。许多研究人员的心态是「如果它没有坏，就不要修理它。」

价值 40 亿美元的 AI 巨星们

共同撰写 2017 年论文的研究人员离开谷歌后，他们继续创办创业公司，包括生产企业软件的 Cohere，以及由 Noam Shazeer 创办的 Character.ai，Noam Shazeer 是该小组中在谷歌任职时间最长的人，曾被视为公司的人工智能传奇人物。

根据研究公司 Pitchbook 和价格追踪网站 CoinMarketCap 的估值统计，他们的企业总价值约为 41 亿美元。可以说，他们是硅谷的人工智能的「贵族」。

八位作者在谷歌的工作时长

Polosukhin 此后创办了一家区块链公司。Vaswani 和 Niki Parmar 创办了企业软件公司 Essential.ai。Uszkoreit 喜欢挑战人工智能研究的现状——他的观点是，如果它还没有被打破，那就打破它，此后他与他人共同创立了一家名为 Inceptive Nucleics 的生物技术公司。

2016 年，Uszkoreit 探索了人工智能中「注意力」的概念，即计算机区分数据集中最重要的信息。一年后的午餐时，三人讨论了如何利用这个想法来更有效地翻译单词。当时的谷歌翻译很笨拙，尤其是对于非拉丁语言。「汉语转俄语太糟糕了，」Polosukhin 回忆道。

其中一个问题在于循环神经网络处理序列中的单词。它很慢并且没有充分利用可以同时处理大量任务的芯片。家用计算机中的 CPU 可能有四个「核心」，用于处理和执行指令，但用于处理人工智能系统的服务器中的 CPU 有数千个核心。这意味着人工智能模型可以同时「读取」句子中的许多单词。没有人充分利用这一点。

Uszkoreit 会在 Google 办公室里走来走去，在白板上画出新架构的图表，并且经常遭到怀疑。琼斯说，他的团队希望删除当时使用的循环神经网络中的「循环」部分，这「听起来很疯狂」。但随着 Parmar, Aidan Gomez 和 Lukasz Kaiser 等其他一些研究人员加入该小组，他们开始看到进展。

曾经，硅谷「八叛逆」改变了集成电路的历史，如今谷歌的「八叛逆」会给世界带来怎样的变化？