Sublime
An inspiration engine for ideas
vicente depdel
@vicente
parenting
Jon McBirney • 1 card




3-mini 和 deepseek-R1 都“死记硬背”了这一题。
点出题目不是你刷过的原题后,一个模型悟了,另一个模型裂了。🥴
没想到,这个测试是一个极好的例子,展示了模型的过拟合现象,语言和推理能力都泛化现象。 https://t.co/WzuIjr8URe
Guy
@gdup
Sebastien
@strudel