Sublime
An inspiration engine for ideas

炸裂!
斯坦福大学以及华盛顿大学的研究团队展示了一种极低成本的 AI 训练方法,被称为 S1。
1️⃣ S1 仅使用 6 美元就能达到 OpenAI o1-preview 级别的推理性能!同时匹敌Deepseek R1
2️⃣ 推理时间可控:S1 通过简单的“Wait”机制,控制大模型的思考时间,提高推理能力。
🔹 S1 不是 OpenAI o1 或 DeepSeek R1 的直接复刻,但它揭示了在推理时微调 AI 的潜力,甚至可以媲美 Reinforcement Learning(强化学习)。
OpenAI 和 DeepSeek 早期研究发现,AI 在回答问题时“思考得更久”,往往能得出更好的答案。但过去并没有清楚解释:如何在推理阶段控制 AI 的思考时间?
📌 S1 的创... See more