Sublime
An inspiration engine for ideas

发现KOLO工具里面写了个大模型微调指南,想了解微调(fine-tuning)的同学可以看下。
我的建议是,如果真的想自己微调/量化,记得试试unsloth。过去几个月最令我震撼的量化版本就是unsloth团队的DeepSeek-V3-Q2, 我是没想到2bit量化能用的.
指南地址:https://t.co/jZZ6cWgHEB
#... See more

大语言模型显卡天梯光速更新,新增了老黄刚刚发布的 NVIDIA Project DIGITS 128GB 桌面超级计算机。好消息是,单台就能跑70b级别的模型,坏消息是,跟MacBook M4 Pro 差不多.... 都是 LPDDR5X。[1/2]
天梯地址:https://t.co/y2UTMoHmSG... See more

看到个非常好的教材——机器学习中的数学
担心线性代数需要补课的同学有福音了:免费的嗷
PDF地址:https://t.co/CpESmA7KTl... See more

使用DeepSeek-R1蒸馏属于自己推理小模型!
昨天介绍了使用DeepSeek-R1蒸馏出普通模型,今天是蒸馏出推理模型!
还记得那个复现DeepSeek-R1的aha时刻(可以理解成顿悟,模型能推理了)的项目Tiny -Zero吗?但是这个项目门槛比较高,需要4块A100显卡。 https://t.co/XZerdninHB
Github Copilot 支持Agent了,简单来讲就是可以同时修改多个文件,进行迭代修改 (有点类似虚拟员工),从而完成更复杂的工作。
vscode直接就能用,介绍地址:https://t.co/m7TMTpbeix... See more
karminski-牙医x.com
分享反编译大模型!LLM4Decompile。反编译工作不需要苦哈哈盯着intel汇编头痛了,这个模型可以将 x86_64二进制程序反编译为C代码
我看了下模型大小从1.3B到22B都有,22B如果Q4量化的话只有10G左右,Q8大概22G。好一点的显卡就能本地用了
项目地址:https://t.co/3e4Rre8CR7... See more
My little brother had a cavity diagnosed this summer at the dentist.
Instead of doing a filling, I had him swish Vitamin D+K in his mouth daily, and had him switch to a hydroxyapatite toothpaste.
This past month at his follow-up visit, there wasn’t a cavity to fill.
︎ Modern Mythos ︎x.com
Clinic Info, Appointment Schedule, and User Menu https://t.co/PMPn58n9c0