本仓库演示了如何在 CNB 上快速运行 Hunyuan-A13B 模型 Instruct-GPTQ-Int4 尺寸的推理服务
sh start-api-server.sh
sh openapi.sh
openapi.sh
--max-model-len
演示了如何在 CNB 上快速运行 Hunyuan-A13B 模型 Instruct-GPTQ-Int4 尺寸的推理服务