Sublime
An inspiration engine for ideas
Search
All
People
Collections
Articles
Audio
Books
Files
Highlights
Images
Links
Notes
Text
Tweets
Videos
Social
英伟达宣布,GB200处理器优化后的DeepSeek R1能获得20倍的综合成本提升 推出针对 Blackwell 的 DeepSeek-R1 优化,相比四周前的 NVIDIA H100,可以让企业实现 25 倍收入增长,同时每个 token 成本降低 20 倍。 这一突破得益于 TensorRT DeepSeek 对 Blackwell 架构的优化,包括 FP4 精度,在保持行业领先生产准确度的同时,在 MMLU 通用智能基准测试中达到了 FP8 的 99.8% 评分。
勃勃OC
x.com
a
ang w
@algerwn
4月7日,人民日报:“美国滥施关税,将对我们造成冲击,但天塌不下来” 博主“荆子酷”评价:空而又空、虚而又虚、文章写尽太平事,不肯俯首见苍生。这就是在不承认困难。不承认困难,就是最大的困难。“荆子酷”还引用了一张人民日报“亩产万斤”的图片。 目前这篇文章已被删除。 https://t.co/TNZQphIK2L
李老师不是你老师
x.com
what’s x here? this one’s a thinker https://t.co/6ng9nne8r4
gon
x.com
reactbits 这个动画库相当不错👍 reactbits[.]dev
宝玉
x.com
w
wzangen wang
@wzangen
“强化学习之所以厉害,是因为它能大大缩小模型搜索空间,只需关注那些被简单的验证器(reward model)认可的策略!” 以下内容为转译 --- 一年半前,我们提出了一个看似简单的问题:在大模型微调时使用强化学习(RL),究竟有什么实际的好处?经过我博士生涯中最深入的一次探索,我非常兴奋地分享我们的发现:RL在基于人类反馈的强化学习(RLHF)中的价值,来自一种被我们称为「生成-验证落差」(generation-verification...
See more
宝玉
x.com
等不到明天了,现在写了发出来。 https://t.co/OfJofyXiZA
Vincent
x.com
https://t.co/xSgiYfMj8m
ًecho
x.com