Sublime

Thumbnail of www-x-com-bboczeng-status-1894246521488781641

英伟达宣布，GB200处理器优化后的DeepSeek R1能获得20倍的综合成本提升推出针对 Blackwell 的 DeepSeek-R1 优化，相比四周前的 NVIDIA H100，可以让企业实现 25 倍收入增长，同时每个 token 成本降低 20 倍。这一突破得益于 TensorRT DeepSeek 对 Blackwell 架构的优化，包括 FP4 精度，在保持行业领先生产准确度的同时，在 MMLU 通用智能基准测试中达到了 FP8 的 99.8% 评分。

勃勃OC

x.com

ang w

@algerwn

Thumbnail of www-x-com-whyyoutouzhele-status-1909164867824877597

4月7日，人民日报：“美国滥施关税，将对我们造成冲击，但天塌不下来” 博主“荆子酷”评价：空而又空、虚而又虚、文章写尽太平事，不肯俯首见苍生。这就是在不承认困难。不承认困难，就是最大的困难。“荆子酷”还引用了一张人民日报“亩产万斤”的图片。目前这篇文章已被删除。 https://t.co/TNZQphIK2L

李老师不是你老师

x.com

what’s x here? this one’s a thinker https://t.co/6ng9nne8r4

gon

x.com

reactbits 这个动画库相当不错👍 reactbits[.]dev

宝玉 x.com

wzangen wang

@wzangen

Thumbnail of www-x-com-dotey-status-1898219510500409691

“强化学习之所以厉害，是因为它能大大缩小模型搜索空间，只需关注那些被简单的验证器（reward model）认可的策略！” 以下内容为转译 --- 一年半前，我们提出了一个看似简单的问题：在大模型微调时使用强化学习（RL），究竟有什么实际的好处？经过我博士生涯中最深入的一次探索，我非常兴奋地分享我们的发现：RL在基于人类反馈的强化学习（RLHF）中的价值，来自一种被我们称为「生成-验证落差」（generation-verification... See more

宝玉

x.com

等不到明天了，现在写了发出来。 https://t.co/OfJofyXiZA

Vincent

x.com

https://t.co/xSgiYfMj8m

ًecho

x.com