将总部位于旧金山的初创公司OpenAI开发的免费文本生成AI称为ChatGPT,成功是一个巨大的轻描淡写。
截至 12 月,ChatGPT 的月活跃用户估计超过 1 亿。它吸引了各大媒体的关注,并在社交媒体上计划了无数的模因。它已被用于在亚马逊的Kindle商店中编写数百本电子书。它被认为与人合著了至少一篇科学论文。
但OpenAI作为一家企业——尽管利润有限——必须以某种方式将ChatGPT货币化,以免投资者感到烦躁。随着二月份推出高级服务ChatGPT Plus,它朝着这一方向迈出了一步。它今天迈出了更大的一步,引入了一个API,允许任何企业将ChatGPT技术构建到他们的应用程序,网站,产品和服务中。
API 始终是计划。这是OpenAI总裁兼董事长Greg Brockman(也是联合创始人之一)的说法。昨天下午,在 ChatGPT API 发布之前,他通过视频通话与我进行了交谈。
“我们需要一段时间才能使这些API达到一定的质量水平,”Brockman说。“我认为这有点像,只是能够满足需求和规模。
Brockman表示,ChatGPT API由OpenAI广受欢迎的ChatGPT背后的AI模型提供支持,该模型被称为“gpt-3.5-turbo”。GPT-3.5 是 OpenAI 目前通过其 API 套件提供的最强大的文本生成模型;“turbo”绰号指的是 GPT-3.5 的优化、响应速度更快的版本,OpenAI 一直在悄悄地为 ChatGPT 进行测试。
Brockman的价格为每1000个代币0.002美元,或约750个单词,声称API可以驱动一系列体验,包括“非聊天”应用程序。Snap,Quizlet,Instacart和Shopify是早期采用者。
开发gpt-3.5-turbo的最初动机可能是降低ChatGPT庞大的计算成本。OpenAI首席执行官Sam Altman曾称ChatGPT的费用“令人瞠目结舌”,估计每次聊天的计算成本为几美分。(拥有超过一百万的用户,这大概会很快增加。
但布罗克曼说,gpt-3.5涡轮增压器在其他方面得到了改进。
“如果你正在建立一个人工智能驱动的导师,你永远不希望导师只是给学生一个答案。你希望它总是解释它并帮助他们学习 – 这是你应该能够[使用API]构建的系统类型的一个例子,“Brockman说。“我们认为这将使API更加可用和可访问。
ChatGPT API支持My AI,Snap最近宣布的面向Snapchat+订阅者的聊天机器人,以及Quizlet新的Q-Chat虚拟导师功能。Shopify使用ChatGPT API为购物推荐构建了一个个性化的助手,而Instacart则利用它创建了Ask Instacart,这是一个即将到来的收费项目,允许Instacart客户询问食物,并从公司零售合作伙伴的产品数据中获得“可购物”的答案。
“杂货店购物可能需要很大的精神负担,有很多因素在起作用,比如预算、健康和营养、个人口味、季节性、烹饪技巧、准备时间和食谱灵感,”Instacart首席架构师JJ Zhuang通过电子邮件告诉我。“如果人工智能能够承担这种精神负担,我们可以帮助通常负责杂货店购物、膳食计划和将食物放在餐桌上的家庭领导者——并真正让杂货店购物真正有趣?Instacart的AI系统与OpenAI的ChatGPT集成后,将使我们能够做到这一点,我们很高兴开始尝试Instacart应用程序中的可能性。
不过,那些一直密切关注 ChatGPT 传奇的人可能想知道它是否已经时尚,可以发布——这是正确的。
早期,用户能够提示 ChatGPT 以种族主义和性别歧视的方式回答问题,这反映了 ChatGPT 最初训练的偏见数据。(ChatGPT的训练数据包括广泛的互联网内容,即电子书,Reddit帖子和维基百科小哥。ChatGPT还发明了事实,但没有透露它正在这样做,这种现象在人工智能中被称为幻觉。
ChatGPT – 以及类似的系统 – 也容易受到基于提示的攻击,或者恶意对抗性提示,让他们执行不属于其原始目标的任务。Reddit上的整个社区都围绕着寻找“越狱”ChatGPT并绕过OpenAI实施的任何保护措施的方法而形成。在一个不那么令人反感的例子中,初创公司Scale AI的一名工作人员能够让ChatGPT透露有关其内部技术运作的信息。
毫无疑问,品牌不想成为众矢之的。布罗克曼坚持认为他们不会。为什么会这样?他说,其中一个原因是后端的持续改进——在某些情况下,以牺牲肯尼亚合同工为代价。但布罗克曼强调了一种新的(而且争议较少的)方法,OpenAI称之为聊天标记语言或ChatML。ChatML 将文本作为一系列消息与元数据一起提供给 ChatGPT API。这与标准的 ChatGPT 相反,后者使用表示为一系列令牌的原始文本。(例如,“太棒了”这个词将被拆分为“fan”,“tas”和“tic”的标记。
例如,给定提示“我的30岁生日有哪些有趣的派对创意?”开发人员可以选择在该提示后附加附加其他提示,例如“你是一个有趣的对话聊天机器人,旨在帮助用户解决他们提出的问题。在让 ChatGPT API 处理它之前,你应该以有趣的方式如实回答!“或”你是一个机器人”。根据Brockman的说法,这些说明有助于更好地定制和过滤ChatGPT模型的响应。
“我们正在转向更高级别的API。如果你有一种更结构化的方式来表示系统的输入,你说,“这是来自开发人员”或“这是来自用户”……我应该期望,作为一名开发人员,你实际上可以更强大地[使用ChatML]来抵御这些类型的即时攻击,“Brockman说。
另一个(希望)可以防止意外的 ChatGPT 行为的变化是更频繁的模型更新。随着gpt-3.5-turbo的发布,开发人员将默认自动升级到OpenAI的最新稳定模型,Brockman说,从gpt-3.5-turbo-0301(今天发布)开始。但是,如果开发人员愿意,他们可以选择保留旧模型,这可能会在某种程度上抵消好处。
Brockman指出,无论他们是否选择更新到最新型号,一些客户(主要是预算相应的大型企业)将通过引入专用容量计划对系统性能进行更深入的控制。本月早些时候泄露的文档中首次详细说明了OpenAI的专用容量计划,该计划允许客户为运行OpenAI模型(例如gpt-3.5-turbo)的计算基础设施分配付费。(顺便说一下,后端是Azure。
除了对实例负载的“完全控制”(通常,对 OpenAI API 的调用发生在共享计算资源上)之外,专用容量还使客户能够启用更长的上下文限制等功能。上下文限制是指模型在生成其他文本之前考虑的文本;较长的上下文限制允许模型基本上“记住”更多文本。虽然更高的上下文限制可能无法解决所有偏差和毒性问题,但它们可能会导致像gpt-3.5-turbo这样的模型产生更少的幻觉。
Brockman表示,专用容量客户可以期待具有高达16k上下文窗口的gpt-3.5-turbo模型,这意味着他们可以接受标准ChatGPT模型四倍的令牌。这可能会让某人粘贴一页又一页的税码,并从模型中得到合理的答案,比如说——这在今天是不可能的。
布罗克曼暗示未来会全面发布,但不会很快。
“上下文窗口开始爬升,我们现在只为专用容量客户提供的部分原因是因为我们这边有很多性能权衡,”Brockman 说。“我们最终可能能够提供相同事物的按需版本。
鉴于OpenAI在微软投资数十亿美元后扭亏为盈的压力越来越大,这并不奇怪。
#与ChatGPT的有趣对话#
#OpenAI#
#让AI触手可及#