Sublime
An inspiration engine for ideas
Phan Ngọc Đức Thọ
@phanngocductho

关于DeepSeek以及美国AI未来的趋势,马斯克认为最有道理的一篇分析,总结如下:
1,deepseek 600 万美元的训练成本并不包括之前的架构设计、算法实验和数据准备。这意味着如果没有数亿美元的前期投入以及强大的硬件集群(如 DeepSeek 的 数万张 A100 GPU 集群),其他团队无法简单地复现这一成果。
2,DeepSeek 的开发显然依赖了对 GPT-4o 和 o1 的蒸馏,这也说明美国对高端 GPU 出口的限制并未阻止中国获得领先模型的能力。
“为什么要买奶牛(GPU),如果可以免费获得牛奶(蒸馏模型)?”
3,未来趋势:
(1)去中心化推理:推理从云端转移到本地(边缘设备)会引发计算模式的去中心化,可能带来 PC 和智能手机的大规模升级浪潮。
(2)AI 基... See more
Tijn Hoyng
@tijnhoyng
Pat
@tooth
Brian
@brian-ccc3
Diána Hoffmann
@diakockak
AI Code Assistant
BA Builder • 1 card
Whoever’s doing comms for Gemini needs to apologize to Noam Shazeer and then resign
DeepMind doesn’t get nearly as much credit and attention as they deserve, and that’s because comms is vastly underperforming capabilities
You’ve got Demis, Noam, Jeff Dean, and Sergey Brin all