你正确使用了推理模型吗?
OpenAI 发布了一份新的文档《Reasoning Best Practices》,提供了如何有效使用推理模型的指导,不仅包括 OpenAI 的模型,还有其他模型如 Gemini 和 DeepSeek。该文档概述了标准 AI 模型和推理模型之间的关键差异,并提供了如何有效提示这些模型以获得最佳结果的见解。
推理模型介绍
视频中解释的正确使用推理模型的方法
OpenAI 的第一条建议是保持提示简单明了。不要添加多余的修饰词或不必要的词语,只需清晰、直接的指令。这可能显而易见,但许多人仍然会过度复杂化。
简化推理模型的提示
简化提示以从推理模型获得更好结果的重要性
接下来,OpenAI 建议在使用这些推理模型时不要添加“链式思考”提示。这指的是要求模型逐步思考或解释其推理过程,因为它们已经是推理模型,所以没有必要这样做。
避免“链式思考”提示
为什么“链式思考”提示对推理模型来说是不必要的
对于这些推理模型的另一个重要提示是使用分隔符,也就是文本的分隔标志。这可以包括 markdown、XML 标签,甚至是段落标题。例如,你可以在顶部提供上下文,然后是任何示例,最后是你的指令。
使用分隔符获得更好结果
如何使用分隔符帮助推理模型更有效地处理信息
接下来是一个有趣的提示:先尝试零样本,然后在需要时使用少量样本。这意味着在这些推理模型中,你应该首先尝试不提供示例,因为它们的功能强大,通常能够预测你需要哪种文本。
零样本与少量样本提示
了解何时在推理模型中使用零样本和少量样本提示
接下来的两个要点强调了具体性,尤其是在设置条件时。例如,如果你设置了 500 美元的预算,必须明确在请求解决方案时附带的条件。同样重要的是,明确你的提示目标。
具体条件和目标
在提示推理模型时,具体条件和目标的重要性
在进入最后一点之前,让我们回顾一下第一点,即开发人员消息正在取代系统消息。这些消息是引导模型的一种方式。系统提示已经在 API 请求中进行了更改。
回顾开发人员消息
了解开发人员消息在引导推理模型中的作用
现在,在我们继续讨论 OpenAI 发布的其余文档之前,让我展示一个在推理模型中效果很好的示例提示。这要归功于我在 x.com 上发现的 Alvaro Cintas。在这里,你可以看到我们已经将提示结构化为不同的部分:上下文、示例和指令。
推理模型的示例提示
结构化良好的推理模型提示示例
OpenAI 还提供了一个客户服务示例,以进一步澄清其推理模型和非推理 GPT 模型之间的差异。推理模型被称为“规划者”,而非推理模型则被称为“工作者”,因为它们具有更低的延迟和更高的效率。
推理与非推理模型
理解推理模型和非推理模型之间的差异
他们强调了实际使用推理模型的时机。首先,他们谈到了导航模糊任务。这基本上意味着,每当你的提示意图不明确时,这些推理模型不会做出假设,而是会要求澄清,确保理解你的意图后再继续。
导航模糊任务
推理模型如何导航模糊任务
接下来是多步骤代理规划,这意味着通过它们的逐步推理,这些模型可以从头到尾制定完整的计划。这就是为什么它们被称为“规划者”。当代理执行任务时,它能够将不同任务委托给各种 LLM,根据所需计算能力的水平进行分配。
多步骤代理规划
理解推理模型的多步骤代理规划
这些模型最引人入胜的用例之一是视觉推理。由于 01 结合了视觉和推理能力,它能够理解高度详细的设计图纸。OpenAI 甚至提到,它能够通过分析复杂的建筑蓝图生成完整的材料清单。
视觉推理能力
推理模型的视觉推理能力
当涉及到代码时,你可能会认为这些推理模型较慢或效率较低。然而,尽管非推理模型,尤其是 GPT 模型,在编码方面可能有困难,Claude 在这方面表现得更好。但使用推理模型的主要优势是它们犯的错误少得多。这意味着你不需要像使用非推理模型时那样不断纠正小错误。
使用推理模型进行编码
结论
总之,OpenAI 的《Reasoning Best Practices》指南提供了如何有效使用推理模型以获得最佳结果的宝贵见解。通过遵循这些提示技巧,你可以从推理模型中获得更好的结果。记住要简化你的提示,避免使用“链式思考”提示