Run DeepSeek-R1 671b via CNB
快速体验 DeepSeek-R1 671b,无需等待,零帧起步。
fork 本仓库到自己的组织下
- 点击
云原生671b,启动 即可
- 本项目演示了在 CPU 上运行 DeepSeek-R1 671b Q8_0 模型的效果。
- 实测 15s 载入模型,27s 进入对话,生成速度约 7 tokens/s 。
- 免去硬件选购及软件环境搭建的复杂过程,无需GPU,也能快速体验6710亿参数大模型。
- 1.5b~70b 蒸馏版本 - examples/ecosystem/deepseek