logo
4
0
Login

Qwen-image LoRA Trainer:云原生一键部署的视觉大模型训练平台

本项⽬是基于业界知名的开源项目 ai-toolkit 进行的深度二次开发,旨在为广大AI开发者和爱好者提供一个开箱即用、高效便捷Qwen-image 模型 LoRA (Low-Rank Adaptation) 微调训练解决方案。

为了最大程度地简化部署和运维成本,我们已将整个环境无缝集成到腾讯云云原生应用平台(CNB),实现了真正意义上的一键部署和云端训练。无论您是经验丰富的算法工程师,还是初涉AI领域的新手,都能通过本平台轻松开启您的大模型微调之旅。

✨ 核心特性 & 优势

  • 专注 Qwen-image LoRA 训练: 项目核心功能是为通义千问视觉语言大模型(Qwen-image)提供高效的 LoRA 训练支持。LoRA 是一种轻量级的模型微调技术,它通过在原有大模型上附加小型可训练的“适配器”层,实现在不改动原始模型权重的情况下,用更少的计算资源更短的时间来训练模型以适应特定任务,非常适合个性化定制和快速迭代。

  • 广泛的模型兼容性: 除了对 Qwen-image 的深度支持,平台同样兼容了当前业界众多主流的文生图及相关AI模型,包括:

    • FLUX.1 & FLUX.1-Kontext-dev: 新一代高效文生图模型。
    • HiDream: 专注于高质量图像生成的模型。
    • Stable Diffusion (SD) 1.5 & SDXL: 开源社区最流行、生态最丰富的文生图基石模型。
    • WAN2.1 & WAN2.2: 其他优秀的图像生成模型。 这使得本平台成为一个多功能的AI模型训练与推理工作台。
  • 极致简化的一键云原生部署: 依托腾讯云 CNB 的强大能力,彻底告别繁琐的本地环境配置(如 Python 版本管理、CUDA 驱动安装、依赖库冲突等问题)。您只需轻点几下鼠标,即可在云端自动构建一个包含所有依赖、配置完善的训练环境。

  • 可视化 WebUI 操作界面: 项目内置了一个功能丰富的图形化操作界面(WebUI),让模型训练、参数调整、进度监控、模型管理等操作变得直观简单。其中,部分界面已由贡献者 johnnycui 进行了汉化,极大地提升了中文用户的使用体验。

🚀 快速上手指南 (腾讯云 CNB 一键部署)

本项目经过深度优化,旨在提供在腾讯云云原生应用平台(CNB)上“零配置”的部署体验。

第一步:准备您的代码仓库

  1. Fork 本仓库: 在 GitHub 页面右上角,点击 "Fork" 按钮。这将把本项目的完整代码仓库复制一份到您自己的代码托管账户下,为您后续的云端部署和个性化修改做好准备。

第二步:在腾讯云 CNB 中启动云原生开发环境

  1. 进入云原生开发: 导航至您刚刚 Fork 好的仓库,点击页面右上角的 “云原生开发” 按钮。
  2. 启动云端 VS CODE: 系统将自动为您启动一个预配置好的云端 VS CODE 开发环境。这是一个功能完整的在线IDE,包含了运行本项目所需的一切基础环境。
  3. 自动化启动: 进入环境后,您无需执行任何运行命令。项目内置的 start-services.sh 启动脚本已设置为自动执行。您会在终端看到依赖项的安装日志。请耐心等待几分钟,让系统完成环境初始化。

第三步:下载和准备模型文件

在等待依赖安装的过程中,您可以并行开始准备模型文件。

  1. 打开终端: 在云端 VS CODE 界面中,通过菜单栏的 Terminal > New Terminal 或使用快捷键 Ctrl + ~ (Windows/Linux) / Command + ~ (Mac) 打开一个新的终端面板。

  2. 创建模型存储目录: 为了规范管理模型文件,首先创建一个专用的 models 文件夹并进入该目录。请在终端中输入并执行以下命令:

    mkdir models cd models
  3. 克隆 Qwen-Image 模型: 执行以下命令,从CNB提供的模型仓库中克隆 Qwen-Image 的基础模型。

    git clone https://cnb.cool/ai-models/Qwen/Qwen-Image
  4. 下载其他模型 (可选): 如果您需要使用其他兼容的模型,可以访问 CNB AI 模型仓库 浏览并获取它们的克隆地址,然后使用 git clone 命令下载到 models 文件夹下。

第四步:访问并开始使用 WebUI

  1. 监控端口状态: 将您的注意力转移到云端 VS CODE 界面的左侧面板,找到并点击 "PORTS" 选项卡。这里会实时显示当前应用对外暴露的网络端口。

  2. 访问Web界面: 当初始化和部署流程全部完成后,您会看到列表中出现一个端口号为 8675 的服务。点击该端口号右侧的 地球图标(Open in Browser) 链接。

  3. 开始训练: 浏览器将自动打开一个新的标签页,加载出 Qwen-image LoRA Trainer 的 Web 操作界面。至此,您已成功部署整个平台,可以开始上传数据集、配置训练参数,启动您的第一个模型微调任务了!

鸣谢

  • 本项目的诞生与发展,离不开 ostris/ai-toolkit 项目所奠定的坚实基础。我们在此向原作者的卓越工作和开源精神致以最诚挚的感谢。

About

No description, topics, or website provided.
318.04 MiB
4 forks0 stars1 branches0 TagREADMEMIT license
Language
Python89.5%
TypeScript9.1%
Shell0.1%
Dockerfile0.1%
Others1.2%