Home Hot Topic Column Review Our Blog Quotations About Us Events Join Us Bilingual Link

OpenAI 推出新模型 CriticGPT，让 GPT-4 帮人类训练 GPT-4

OpenAI 公布，其研究人员训练了一个基于 GPT-4 的模型，它被称为 CriticGPT，用于捕捉 ChatGPT 代码输出中的错误。简单来说就是，CriticGPT 让人能用 GPT-4 查找 GPT-4 的错误。它可以写出使用者对 ChatGPT 响应结果的批评评论，从而帮助人类训练者在 RLHF 期间发现错误。

OpenAI 发现，如果通过 CriticGPT 获得帮助审查 ChatGPT 编写的代码，人类训练师的审查效果比没有获得帮助的人强 60%。OpenAI 称，正着手将类似 CriticGPT 的模型集成到旗下 RLHF 标记管道中，为自己的训练师提供明确的 AI 帮助。

OpenAI 称，因为没有更好的工具，所以人们目前难以评估高级的 AI 系统的表现。而 CriticGPT 意味着，OpenAI 向能够评估高级 AI 系统输出的目标迈进了一步。

（来源：博客中国）

2024年7月1日 23:04

ꂃ上一篇：无

ꁹ下一篇：无

OpenAI 推出新模型 CriticGPT， 让 GPT-4 帮人类训练 GPT-4

OpenAI 推出新模型 CriticGPT，让 GPT-4 帮人类训练 GPT-4