自从去年三月GPT-4发布以来,围绕GPT-5的发布时间和潜在功能的猜测一直不断。对此,OpenAI鲜少置评。
尽管公司名字中带有“开放”二字,但在新产品发布方面,OpenAI的保密程度几乎堪比苹果——通常在认为时机成熟时才会突然在X上发布。
然而,《商业内幕》报道称,我们可能在今年夏天就能看到这一旗舰模型与ChatGPT一同亮相,且与GPT-4有“实质性不同”。
夏季发布的传闻似乎源于获得新OpenAI模型早期访问权的第三方公司。这些OpenAI的企业客户是公司收入的重要来源,有助于覆盖运行日益庞大的模型所需的不断增长的成本。
尽管OpenAI首席执行官Sam Altman在与Lex Fridman的采访中暗示今年将发布新模型,但不一定是GPT-5,这与夏季发布的传闻相矛盾。
Altman在去年11月首次透露GPT-5已开始训练,如果它的规模不比前代大得多,那么这项工作可能需要数月时间。
《商业内幕》的报道表明,他们已经超越训练阶段,进入了“红队测试”阶段,尤其是如果他们正在向第三方公司提供演示。尽管这假设我们所讨论的是GPT-5。
红队测试是将模型置于极端情况下进行安全性测试的阶段。红队测试之后的下一阶段是微调模型,纠正测试期间发现的问题,并增加防护措施,使其准备好公开发布。
这一阶段本身可能需要数月时间,GPT-4的情况就是如此,因此所谓的GPT-5夏季发布实际上可能是GPT-4.5。毕竟,OpenAI之前曾有一个关于GPT-4.5-Turbo的博客帖子被泄露给了Bing。
这将符合前几代产品的发布模式,从GPT-3到GPT-3.5,然后是GPT-4。我们也看到了GPT-3.5-Turbo然后是GPT-4-Turbo,现在在Microsoft Copilot中免费提供。
对于GPT-5,我们能期待什么?Altman此前表示,GPT-5将是迄今为止相比之前任何一代模型的重大进步。这将包括视频功能——即理解视频内容的能力——以及显著改善的推理能力。
除了采访中的夸大表述外,几乎没有透露具体细节。我们知道它很可能比GPT-4更大,有更多的参数,但具体增加了多少尚不清楚。
Nvidia首席执行官黄仁勋在GDC上透露,GPT-4有1.8万亿个参数,训练它需要30yottaflops的计算能力——这相当于连续运行了93,000年的十亿台PS5。
然而,我们不知道他们在训练GPT-5时是否利用了Nvidia的新exaFLOP GPU平台。Nvidia Blackwell芯片的一个相对较小的集群可以在几天而不是几周或几个月内训练一个万亿参数的模型。
Altman表示,GPT-5将比以往的模型更加智能。他在与Fridman的采访中说:“我对它变得更聪明感到兴奋,它在各个方面都在改进。”
虽然最初有人猜测GPT-5可能是人类超级智能,也称为人工通用智能(AGI)的第一个迹象,但看起来尽管它将是GPT-4的一个飞跃,但不会是一个巨大的飞跃。