o1 系列模型通过强化学习进行训练,以执行复杂的推理。o1 模型在回答之前会进行思考,在回应用户之前产生一条长的内部思维链。
推荐模型
claude-3-5-sonnet-20241022-rev
gpt-4.1-nano-2025-04-14
o3-mini