Sublime
An inspiration engine for ideas
Bluesky
bsky.app

Anthropic 的 CEO Dario 也特别针对 DeepSeek 发了一篇新文章,他的政治立场很清晰,在任何场合都是一致的没有变过,大家可以抛开立场来从 Dario 的技术视角看 DeepSeek 的成功🏅 DeepSeek 不是竞争对手,他们看起来像是聪明的、充满好奇心的研究人员,只是想创造有用的技术。
他认为真正的创新主要集中在工程效率上:DeepSeek 团队对「键-值缓存」(Key-Value cache)的管理和「专家混合」(mixture of experts) 方法的运用都做出了创新性改进,从而在一些关键任务上以更低成本达到了与美国顶尖模型相近的性能。
2020 年,Anthropic 的团队发表过一篇论文 https://t.co/qTlvJYQUqN... See more

芯片数据摸底还得靠 SemiAnalysis!今天最新这篇提到了 DeepSeek 拥有的 GPU 数量不是某些人声称的 50,000 个 H100,而是 10,000 个 H800 和约 10,000 个 H100,剩下 30,000 左右的 H20,这是 Nvidia 在出口管制法案之后为中国市场定 制的。
SemiAnalysis 的分析表明,DeepSeek 的服务器 CapEx 总额接近 13 亿美元,这些 GPU 由 High-Flyer 和 DeepSeek 共享,它们被用于交易、推理、训练和研究!
文章中最有趣的观点就是 AI 模型产业与芯片产业的类比,就像在最新一期的 Indigo Talk 中提到的 - 大模型正在商品化,与芯片制造工艺迭代逻辑类似。
1. 前沿能力带... See more




送给币圈链上小白 | 短的入门指南
这几天因为Trump,币圈流量曝光大了很多,多输出一些东西吧,刚好缓缓心情。这个聚合会包含我自己写过的一些以及周围比较靠谱的KOL朋友写的一些心得。最终还是要靠自己多亏钱+多摆正心态+降低试错成本,活的更久才可以在这个市场上赚到钱!相信自己是最大的Alpha!
先放"干货",虽然我没怎么赚到钱,至少看过周围一些dalao怎么从0做到A8甚至A9的,总结下来链上能赚钱大概有几种模式(包含且不限于):
1. 自己搭建信息流组FNF(监控、新闻交易)
2. 扫链/扫链Group(自己扒链上、找聪明钱包)
2. 运营账号写干货(喊单、抽水、接广子)
3. 摆烂跟单(跟单KOL,找靠谱的让利的庄)
4. 玩人脉社交(拿内幕、New Cabal、其他合作模式)
... See more




Can't wait for when I can vibe code a production recommender system.
Until then, here's some system designs:
• Retrieval vs. Ranking: https://t.co/zTsfElM3R7... See more