博客专栏

EEPW首页 > 博客 > ChatGPT开启了一场新的人工智能竞赛——让文本框再次变得很酷

ChatGPT开启了一场新的人工智能竞赛——让文本框再次变得很酷

发布人:12345zhi 时间:2023-03-27 来源:工程师 发布文章

By David Pierce

Mar 26, 2023, 9:00 PM GMT+8

很明显,没有人预见到ChatGPT的到来。甚至OpenAI也没有。从某种程度上说,ChatGPT还没有成为历史上增长最快的消费应用,还没有把“生成式预训练变形金刚”变成俗语,还没有你能想到的每一家公司都在竞相采用它的基础模型,ChatGPT于去年11月作为“研究预览”发布。

这篇宣布ChatGPT的博客文章现在成了一个关于低价抛售的搞笑案例。ChatGPT是InstructGPT的兄弟模型,后者经过训练,可以遵循提示中的指令并提供详细的响应。我们很高兴引入ChatGPT,以获得用户的反馈,并了解其优缺点。”就是这样!这就是整个宣传!没有像诗歌一样,从根本上改变我们与技术互动的本质,甚至没有一句关于它有多酷的歌词。这只是一个研究预习。

但现在,仅仅四个月后,ChatGPT似乎真的要改变我们对技术的看法了。或者,更准确地说,把它变回来。因为从我们的发展方向来看,技术的未来并不是神奇的界面或元宇宙。它是“在计算机上的文本框中输入命令”。命令行又回来了——它现在聪明多了。

实际上,生成式AI正同时朝着两个方向发展。第一个是更多的基础设施,为您已经使用的东西添加新的工具和功能。像GPT-4和谷歌的LaMDA这样的大型语言模型可以帮助你写电子邮件和备忘录;他们会自动整理你的幻灯片,并纠正你电子表格中的错误;他们会比你更好地编辑你的照片;他们会帮你写代码,在很多情况下只是为你做。

Three screenshots of Pizza Hut’s chatbot

还记得所有人,甚至是必胜客,都在用聊天机器人吗?

这大概是人工智能多年来一直在走的道路,对吧?在过去的几年里,谷歌一直在将各种人工智能集成到其产品中,甚至像Salesforce这样的公司也建立了强大的人工智能研究项目。这些模型创建成本高,训练成本高,查询成本高,并且可能会改变企业生产力的游戏规则。在你已经使用的产品中增强人工智能是一项大业务——或者,至少正在投资于一项大业务——而且会持续很长一段时间。

另一个AI方向,即与AI互动成为一种消费产品,是一个不太明显的发展。当然,现在这是有道理的:谁不想和一个知道所有电影、食谱以及在东京可以做什么的机器人聊天呢?如果我说得对,它可能会完全偏离轨道,试图和你亲热呢?但在ChatGPT席卷全球之前,在Bing和Bard都采纳了这个想法并尝试基于它构建自己的产品之前,我当然不会打****在聊天窗口中输入会是用户界面的下一个大事件。

在某种程度上,这是一个非常古老的想法的回归。多年来,大多数用户只能通过在空白屏幕上输入来与计算机交互——命令行就是你告诉机器该做什么的方式。(是的,ChatGPT是很多机器,它们不在你的桌子上,但你知道的。)

但随后,有趣的事情发生了:我们发明了更好的界面!命令行的问题在于,您需要确切地知道输入什么以及以何种顺序使计算机运行。指向和点击大图标要简单得多,而且通过图片和图标告诉人们计算机能做什么也容易得多。命令行让位于图形用户界面,GUI仍然占据主导地位。

不过,开发人员从未停止过让聊天UI工作的尝试。WhatsApp就是一个很好的例子:该公司花了数年时间试图弄清楚用户如何使用聊天与企业互动。Allo是谷歌众多失败的消息应用之一,它希望你可以在与朋友的聊天中与人工智能助手互动。聊天机器人的第一轮炒作大约发生在2016年,当时有很多非常聪明的人认为即时通讯应用程序是一切的未来。

消息传递界面,也就是“对话式AI”有一些诱人之处。首先,我们都知道如何使用它;即时通讯应用是我们与最关心的人保持联系的方式,这意味着我们在这些应用上花费了大量的时间和精力。你可能不知道如何浏览优步(Uber)应用,也不知道如何在西南航空(Southwest)的应用中找到你的常旅客号码,但“把这些话发往这个号码”几乎是每个人都能理解的行为。在一个人们不想下载应用程序和手机网站的市场中,****可以在很大程度上简化用户体验。

A screenshot of the new Bing chatbot.

必应(Bing)(以及其他所有公司)正在使用聊天界面。 图片:微软

此外,虽然消息传递不是最先进的接口,但它可能是最可扩展的接口。以Slack为例:你可能认为它是一个聊天应用程序,但在这个来回交互的界面中,你可以嵌入链接、可编辑文档、交互式投****、信息机器人等等。微信是著名的一个完整的平台——基本上是整个互联网——整合成一个消息应用程序。你可以从消息开始,去很多地方。

但这些工具中有很多都以同样的方式出错。对于快速交换信息,比如工作时间,聊天是完美的——提出一个问题,然后得到答案。但是将浏览目录作为一系列消息呢?不,谢谢。用上千条来回的****买机****?很难通过。它和语音助手没有什么不同,如果你曾经尝试用Alexa买简单的东西,上帝会帮助你。(“对Charmin来说,说‘三’。”)对于大多数复杂的事情,一个可视化的专用UI远比一个消息窗口好得多。

当涉及到ChatGPT、Bard、Bing和其他东西时,事情很快就变得复杂起来。这些模型是聪明的和协作的,但你仍然必须确切地知道要什么,以什么方式,以什么顺序来得到你想要的东西。“提示工程师”的想法,即你付钱让他们知道如何从Stable Diffusion中获得完美的图像或让ChatGPT生成正确的Javascript,看起来很荒谬,但实际上是等式中完全必要的一部分。这与早期计算机时代没有什么不同,当时只有少数人知道如何告诉计算机该做什么。现在已经有了市场,你可以在上面购买和出售非常棒的提示;有关于提示的专家和书籍;我想斯坦福大学已经开始开设快速工程专业了,大家很快就会开始学习。

生成式AI的非凡之处在于,它感觉上几乎可以做任何事情。这也是整个问题所在。当你什么都能做的时候,你会做什么?你从哪里开始呢?你如何学习如何使用它,当你唯一的窗口,它的可能性是一个闪烁的光标?最终,这些公司可能会开发出更可视化、更具互动性的工具,帮助人们真正理解他们能做什么以及它是如何工作的。(这是关注ChatGPT新插件系统的一个原因,它目前非常简单,但可以迅速扩展你在聊天窗口中可以做的事情。)现在,他们所能想到的最好的办法就是就你可能输入的内容提供一些建议。

人工智能将成为一个特色。现在是乘积。这意味着文本框回来了。消息传递也是接口。

文章来源:https://www.theverge.com/2023/3/26/23655456/chatgpt-bard-bing-ai-race-text-boxes

*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。



关键词: ChatGPT 人工智能

相关推荐

技术专区

关闭