Sublime
An inspiration engine for ideas

看看这篇论文:《7B Model and 8K Examples: Emerging Reasoning with Reinforcement Learning is Both Effective and Efficient》7B 小模型:如何用 8000 个示例,“炼”出会自我反思的 AI?
我有个朋友,每次听到「AI」都惊呼:“完蛋了!以后我们是不是都要给机器人打工啊?” 还有个做大语言模型的朋友,一提到「大模型」就一脸绝望:“没个几万块的服务器,没个海量数据,还搞什么人工智能?”
今天我要说的故事,正是要打破这些“AI门槛高到太平洋”的刻板印象:告诉你,小到只有... See more













