OpenAI谈ChatGPT：推出时期望低，现称是研究预览并补缺陷

admin AI新闻 2026-06-10 18

当OpenAI于2022年11月底推出GPT之际, 几乎未曾怀着任何特别的期待, 而当GPT开始在网上如同病毒般迅速传播之后, OpenAI慌慌张张地展开追赶, 并且借助这次契机完善自身的模型。

在周五的时候, 当处于接受 MIT Technology Review 采访的状况下, OpenAI 团队针对这次“成功”这一情况, 显得格外的谦逊。

openAI人工智能政策研究人员Sandhini Agarwal称, 此在内部为一次“研究预览”被看待, 是一个存两年之久技术的更臻善版本, 是一回借搜集用户反馈来补救其不足的尝试。另一位研究人员Liam Fedus还指出, openAI无意愿将其像当作重大的突破那般过度宣扬。

从11月开始, OpenAI多次更新了GPT, 研究人员运用一种叫“对抗性训练”的技术, 去阻止GPT“越狱”, 一系列工作让多个聊天机器人相互对抗, 一个聊天机器人担当对手, 凭借生成文本对抗另一个聊天机器人, 从而迫使它突破常规限制。

除此之外, OpenAI与微软签订订立了一项价值高达数十亿美元的协议, 并且宣告与全球管理咨询公司贝恩构建联盟, 其目标是经由突破性的人工智能技术来强化客户的业务潜力。在OpenAI范围之外, 围绕GPT兴起了一场“大模型”的淘金热潮, 全球各个地方的公司以及投资者都踊跃积极投身参与其中。

以下是采访的具体内容：

火的完全“出乎意料”，会话数据对GPT产生了巨大的积极影响

Jan Leike（那个负责提高系统安全性团队的负责人）表示: 说实话, 这确实是那种没办法阻挡的情况, 我们感受到意外, 而且一直在用功把它变好。

约翰·舒尔曼（联合创始人）: 在发布过后的那几天当中, 我时常去查看推特, 在那段处于疯狂状态的时间里呢, 到处都是充斥着GPT的截图。我期望它能够获取到更多的关注度, 然而我并没有预料到它居然能够火到像这样厉害的程度。

名为Sandhini Agarwal从事人工智能政策研究工作的人表示, 我觉得这对围绕在共同生存状态中的大家伙而言绝无仅有地是一件让人感到意外惊喜不已之事, 有一些个别人士起了运用它的行为举动。我们针对这些类属性事物模型开展以及实施了数量巨大且繁多的研究工作程度之深, 直至达到了我们已然忘却它们有的时候面向外界范畴之内是存在致使他人感到惊奇诧异的情况这样的程度。

利亚姆·费杜斯（身为人工智能政策研究员）称: 我们对它所引发的反响感到十分惊讶, 在这之前, 有无数人曾尝试运用聊天机器人, 可是, 透过我们的私人测试版, 我们确信, 我们收获了也许人们真有可能会喜爱的事物。

扬·莱克表示, 其想要更为深入地弄明白究竟是什么促成了这所有的一切, 究竟是什么促使着病毒性传播得以发生。平实地讲, 这般情况之下, 他们并不清楚。

团队存在部分困惑, 这困惑源于GPT当中的多数技术并非全新, GPT是GPT - 3.5的一个经过微调的版本, GPT - 3.5是OpenAI在聊天机器人发布以前几个月研究出来的大型语言模型。GPT - 3.5自身是GPT - 3的更新版本, 它在2020年发布。OpenAI于2022年1月发布了GPT - 3.5的微调版本, 其名为InstructGPT。然而这些早期版本的技术都未曾面向公众予以发布。

利亚姆·费杜斯称, GPT模型是从和InstructGPT一样的语言模型里进行微调而得出的, 我们增添了一些会话数据, 并且在训练进程中做了一些微调。

我们并不打算把它当作一个有重大意义的突破去过多宣传, 然而事实表明, 会话数据给GPT带来了特别显著的积极作用。运用标准基准测试来评定原始技术能力, 实际情况是模型互相之间并没有实质方面的不同, 只是GPT在访问以及使用上比较便于操作。

“不要等到完美的时候再发布它”

桑德希尼·阿加瓦尔: 在我们着手准备发布之际, 我们并未觉得这个模型存有其他新生风险, GPT - 3.5已然发布, 我们清楚它已然具备足够的安全性。借助基于GPT对人类偏好的训练, 此模型能够自行学习拒绝行为表现, 也就是拒绝数量众多的请求。

Jan Leike, 咱们真切地针对GPT开展着一些额外的“红队测试”（red teaming）, OpenAI里的每一个人都在尝试着去打破这样的模式, 存在一些外部团体也在做相同的事儿, 与此同时, 我们也就有了一个较早的访问规划, 而这个规划是由那些值得信任的用户给予反馈意见构成的。

Sandhini Agarwal: 我们的确发觉它输出某些并非必要的内容, 因而作为这么一个“研究预览”, 此种意图是不错的。

约翰·舒尔曼表示, 你绝不能够等到你的那套系统臻于完美状态之后才去将它发布出来, 我们已然针对早期版本展开了为期好几个月的测试阶段, 参与测试的相关人员对于该款产品持有比较良好的印象, 我们最为忧心的要点在于真实性方面, 毕竟模型存在一种倾向于去捏造一些事物情况的毛病, 然而InstructGPT以及其他一些大型语言模型已然是客观存在那种前提条件了, 所以我们经由思考判断得出这样的认识, 只要GPT在真实性以及其他一系列安全问题范畴之内比那些模型具备更加突出的优势, 想必它就应当会是更为优质、更值得去选择的那一方。于发布之前, 依据我们那有限的评估, 去确认这些模型着实比其他模型在真实性与安全性方面更具优势, 因而我方决定持续发布。

很多问题浮现开运真人app下载苹果版,开运真人app下载，“越狱”亟待解决

桑德希尼·阿加瓦尔表示, 随着GPT像病毒一样扩散开来, 诸多问题才真正显现出来, 这是我们期望能尽快予以解决的关键所在。举个例子, GPT极为擅长去拒绝不良请求, 然而它同样容易编写提示, 以至于它不会拒绝我们期望它拒绝的具体内容。

Liam Fedus表示, 看到用户给出的多样化且具创造性的应用程序, 这一情况是令人兴奋的, 然而, 对于我们来讲, 始终都是把注意力集中在需要改进的那些领域上 , 我们觉得, 透过我们所开展的部署、在这个中获取反馈以及实施改进的迭代流程, 我们能够制造出最为强大的技术 , 然而呢, 伴随技术在不断地发展, 新的问题出现是没办法避免的。

桑迪尼·阿加瓦尔表示: 我们最为需要去解决的那个问题是“越狱”, 在我们察觉到越狱这种情况的时候, 我们会把它增添至训练以及测试数据里。

Jan Leike称, 每当出现更好的模型之际, 我们便想着将它予以发布并展开测试。我们持有极为乐观的态度, 觉得一些具有针对性的对抗性训练能够极大地改进越狱状况。当下尚不清楚这些问题会不会彻底消失开云app在线入口,开云真人官方下载，然而我们觉得, 这至少能够令诸多越狱行为变得愈发困难。

一旦你将这些系统予以安置部署以后, 那便很难切实精准地去预估推测它们实际存在的安全方面的问题, 这是我所认为的情况。所以呢, 监控人们运用系统的目的这一行为, 我们是最为郑重其事重视有加的, 要搞清楚进程中发生了什么, 进而做出相应反应。然而, 当一个系统与现实世界产生关联接触的时候, 后续会发生的所有状况却是很难预先测算出来的。

Sandhini Agarwal: 现下的风险无疑比六个月之前要高上许多, 然而却仍旧低于一年之后的水准。显而易见, 这些模型真正至关重要的一点在于它们所运用的那个环境。和谷歌以及微软的想法是一样的, 它们注定会成为搜索引擎。像搜索这般的大模型所需要的东西, 跟仅仅只是一个供人玩乐的聊天机器人所需之物是不一样的。

我们得搞明白怎样于所有这些各异的用途之间维持平衡, 去创造出在不同环境里对人们有作用的事物，在这些环境中, 期望的行为有可能会出现改变开云手机入口app下载开云app官方入口网站，这增添了更多压力, 我们正在搭建这些模型, 为的是把它们转化成产品, GPT是一种产品, 如今我们拥有了API, 我们在建这种通用技术, 且得保证它在所有方面都能运转正常, 这是我们当下面临的关键挑战之一。

标签： OpenAI ChatGPT 人工智能研究预览技术缺陷

本文地址： http://www.yourphoneheres.com/post/1530.html