一年后的今天,OpenAI显然成为了AIGC时代的引领者,不管是基础模型方面的多模态、更大模型的AGI,还是开发者生态、商业生态的构建,明显开始让我们发现:一个全民都可以自定义的、零门槛的大模型应用开发的时代,已经来临。

撰稿 | 云昭

出品 | 51CTO技术栈(微信号:blog51cto)

深夜又是一场王炸!在ChatGPT发布一周年之际,OpenAI 创始人Altman 在首届开发者大会上全场放大招,台下掌声不断。

无需编程,甚至无需敲键盘,单纯通过语音聊天就能构建一个专属自定义的GPT!这个消息实在太燃了!以至于推特上粉丝们给Altman一个新称呼:GPT创业教父sama!

奥特曼的背后:千千万万个GPT要来了!奥特曼的背后:千千万万个GPT要来了!

如果说一年前,ChatGPT是给全世界的一个惊喜的话,这次的开发者大会,将会彻底解封全球GPT粉丝们的创业门槛。

1、大模型的进化:OpenAI重新定义

首先是三个新版本的GPT模型。非常值得大家关注的有三点:一,输入变长,费用降低,了解到2023年4月的全球事件;二,输出可复现;三,API迎来重大升级:推出Json模式。

上图中可以看出,相比之前8k上下文窗口和偶尔允许对32k的有限访问,这次GPT-4 Turbo的上下文窗口直接提升到128k,因此可以在单个提示中容纳相当于 300 多页纸质书的内容。

图片图片

这就意味着,OpenAI通过此举就可以一下让原来的价格降下来一半还多。与 GPT-4 相比,GPT-4 Turbo的输入tokens价格降到了1/3,输出tokens价格则降到了一半。

图片图片

通常,更大的上下文窗口可以让GPT等大型语言模型理解更多问题,并提供更深思熟虑的回答。OpenAI表示,GPT-4 Turbo对开发人员来说运行成本更低。与GPT-4上的0.03美元相比,每1000个代币(LLM读取的基本文本或代码单位)的输入成本仅为0.01美元。每个输出成本为每1000个令牌0.03美元。

总体而言,OpenAI表示,新版GPT-4比早期版本便宜三倍。

第二,就是输出结果可复现。

众所周知,现有的大模型给出的聊天的结果是不确定的,即便是同样的问题给出的答案也不一样。但OpenAI团队简直就搞定了复现性的难题。开发者可以通过访问新的seed参数和sustem_fingerprint响应字段来提供对确定性输出的一些控制,使模型在大多数时间返回一致的完成结果,从而实现可重复的输出。

此测试版功能对于重调试请求、编写更全面的单元测试以及通常对模型行为具有更高程度的控制等用例非常有用。事实上,OpenAI 也一直在内部使用此功能进行自己的单元测试,并发现它非常有价值。

此外,OpenAI还推出了一项对数概率的功能,可在未来几周内返回 GPT-4 Turbo 和 GPT-3.5 Turbo 生成的最有可能的输出Tokens的对数概率,这对于构建搜索体验中的自动完成等功能非常有用。

第三,对于开发者而言,往往需要对输出和响应进行更多控制,新推出的指令跟踪和Json模式,可以确保模型使用有效的Json响应,函数调用方面也会更加简便快捷。

图片图片

图片图片

当开发者对于输出和模型响应有更多的控制的权力时,就意味着模型已经具备进入“裂变的阶段”的条件。

OpenAI计划在未来几周内发布一款可供生产的Turbo型号,具体日期尚未披露,诸位坐等惊喜。

此外,当然如果你对多模态感兴趣,还有一个新的发布值得尝试。这次推出的API中,包括了 DALL-E 3 和带有视觉、听觉的GPT-4 Turbo。可以利用这些功能进行图像、语音的用例开发。

图片图片

比如,可以生成字幕、文本生成语音、语音解锁语音助手等等。此外,Whisper V3即将推出。

图片图片

2、专有大模型的狂欢

微调大模型也是开发者通常要面临的工作。Altman此次也宣布了两项有关微调的进展:GPT-3.5微调扩展到16k、GPT-4微调即将推出。同时。并表示GPT-4 微调的难度要高于GPT-3.5。

图片图片

对于需要比微调所能提供的更多自定义的组织(特别适用于具有极大专有数据集的域 - 至少数十亿个代币),OpenAI还启动了自定义模型计划,为选定的组织提供了1对1的定制,让其与专门的 OpenAI 研究人员小组将定制 GPT-4 训练到其特定领域。但这仍需排队申请。

3、奥特曼亲身现场演示:聊聊天就可以构建专属GPT

用自然语言构建自己的GPT,这一点太炸裂了。Altman在现场真实演示了构建的过程。全场响掌声雷鸣。

图片图片

不得不说,OpenAI,再一次成功让不同规模的企业,让企业中的所有团队都决定入坑生成式AI了。

定制GPT示例  源:OpenAI定制GPT示例 源:OpenAI

在演示过程中看到的DevDay Event Navigator代理被要求提供帮助和简洁,避免日程安排冲突。OpenAI自动生成了几个对话启动提示,例如“今天的第一个会话是什么?”每个GPT都可以被授予访问网页浏览、DALL-E和用于编写和执行软件的OpenAI代码解释器工具的权限。

Builder界面中还有一个“知识”部分,用于上传自定义数据,如DevDay事件时间表。通过另一个名为Actions的功能,OpenAI允许GPT连接到外部服务,用于访问电子邮件、数据库等数据。

Builder界面 源:OpenAIBuilder界面 源:OpenAI

自定义GPT的引入意味着OpenAI现在正在与Character.AI和Meta等其他人工智能机器人平台竞争,后者最近在WhatsApp、Instagram和Messenger中推出了一系列自己的人工智能角色。OpenAI将其平台定位为比竞争对手更注重实用性,而不是强调行为像人的机器人,尽管它并不反对人们用类人角色构建GPT。

值得一提的是,GPT的创建者将无法查看人们与他们的聊天,也不清楚他们将访问哪些高级使用数据。OpenAI表示,它将监控活动,以阻止欺诈、仇恨言论和“成人主题”等行为。

当GPT商店即将推出时,OpenAI将只接受已验证身份人的代理。开始时,GPT将通过可共享的web链接进行访问。

4、版权盾:有问题,OpenAI负责

OpenAI此前宣布会在系统中内置的版权保护来保护客户。今天,该公司更进一步地推出版权盾——“如果您面临侵犯版权的法律索赔,我们现在将介入并保护我们的客户,并支付由此产生的费用。”版权盾将涵盖ChatGPT Enterprise和OpenAI开发者平台的通用功能。

类似的还有谷歌和微软,谷歌此前就表示,如果使用其嵌入式生成人工智能功能的客户因侵犯版权而被起诉,谷歌将承担法律责任。微软对其Copilot AI产品的企业用户提供了同样的保护。

5、写在最后:游戏规则改变者

一年前,被外界成为人工智能的“iPhone时刻”的ChatGPT,起初只不过是一款被OpenAI内部期望低得不能再低的免费聊天机器人产品,ChatGPT之父Sutskever坦言:“当我们制作 ChatGPT 时,我并不知道它有什么好处。当你问它一个事实问题时,它给了你一个错误的答案。我认为这会很不起眼,人们会说,‘你为什么搞这样的产品?这很无聊!'”

但正是这样一款早就存在、只是重新包装整合、依旧会给出错误答案的聊天产品,彻底刷新了整个行业的进程。

一年后的今天,OpenAI显然成为了AIGC时代的引领者,不管是基础模型方面的多模态、更大模型的AGI,还是开发者生态、商业生态的构建,明显开始让我们发现:一个全民都可以自定义的、零门槛的大模型应用开发的时代,已经来临。

毕竟,OpenAI给GPT的主要目标是:创建一个AI超级智能(AGI)。

——后记——

视线切回国内,其实中国企业在这些方面也都有了布局,百度、阿里、华为、vivo都有了各自的大模型研究进展,而对于企业定制和开发者插件生态也都有了各自的尝试,此外小编也留意到了诸如网易、Soul等在游戏、社交领域也有了此次角色扮演的生成式AI的应用。

不得不说,ChatGPT,着实让全球沸腾了!而中国队们,正在加速!

责任编辑:武晓燕来源: 51CTO技术栈