前置说明:直接Fork仓库运行,不要问怎么用和怎么添加模型,想要玩转“云原生开发”的,git、docker、yaml 的基础知识必须会,点到为止 ···
Qwen2.5-VL加载速度慢的问题已经解决(Torch2.5及以上的版本即可)
基于 CNB 构建一个较新的 VLLM 运行环境