感谢 Neta-Lumina 社区 - 奇葩菌 提供魔改秋叶包,支持了Lumina2的训练
1.微信登录,有一个自己的组织,然后Fork本仓库到自己组织
3.等待日志加载完毕,然后选择 WEBIDE打开 进入codeserver界面
4.等待几秒钟,秋叶训练器自动启动,点击弹出的浮窗或者终端上面的端口选项进入WebUI
cd /workspace/kohya
修改训练脚本 lumina2.0_train.sh 中的参数,然后运行训练脚本
bash ./lumina2.0_train.sh
| 参数名 | 中文 | 功能 | 推荐值 |
|---|
| $pretrained_model | 底模路径 | 设定训练所用的基础模型完整路径 | 无 |
| $vae | VAE路径 | VAE模型路径,对某些新模型架构(如Lumina)很重要 | 无 |
| $train_data_dir | 训练数据集路径 | 存放训练图片的文件夹路径 | 无 |
| $reg_data_dir | 正则数据集路径 | 存放正则化图片的文件夹路径,用于防止过拟合 | 根据需要配置 |
| $output_name | 模型保存名称 | 输出的LoRA模型文件名 | 自定义 |
| $output_dir | 输出目录 | 所有模型最终保存的文件夹 | ./output |
| $resolution | 图片分辨率 | 训练时使用的图像分辨率 | 1024,1024 |
| $batch_size | 批处理大小 | 一次训练处理的图片数量,根据显存大小调整 | 16G显卡设置为1或2 |
| $max_train_epoches | 最大训练Epoch | 整个数据集被完整训练的总轮数 | 10~20 |
| $save_every_n_epochs | 保存频率 | 每隔N个Epoch保存一次模型 | 1或2 |
| $network_dim | 网络维度 (Rank) | LoRA的"秩",决定模型大小和复杂度 | 4~128 |
| $network_alpha | 网络Alpha | LoRA的缩放因子,用于平衡权重 | 通常为network_dim的一半 |
| $clip_skip | Clip Skip | 跳过文本编码器的最后几层,玄学参数 | 2 |
| $seed | 随机种子 | 用于复现训练过程中的随机结果 | 任意整数 |
| $lr | 学习率 | 全局学习率,在特定优化器下生效 | 1e-4 |
| $unet_lr | U-Net学习率 | 图像部分(U-Net)的学习率 | 无需填写,仅需训练unet |
| $text_encoder_lr | 文本编码器学习率 | 文本部分(Text Encoder)的学习率 | 不建议训练te |
| $lr_scheduler | 学习率调度器 | 训练中动态调整学习率的策略 | cosine_with_min_lr |
| $optimizer_type | 优化器类型 | 选择更新模型权重的算法 | AdamW8bit, Prodigy, DAdaptAdam |
| $gradient_checkpointing | 梯度检查点 | 开启后节约显存,但会减慢训练速度 | 1 (开启) |
| $gradient_accumulation_steps | 梯度累积 | 变相放大batch_size,在低显存下模拟大批量训练 | 2~8 |
| $network_dropout | 网络Dropout | 防止过拟合的技术,随机丢弃部分神经元 | 不建议设置 |
| $mixed_precision | 混合精度 | 使用半精度浮点数进行计算,降低显存消耗 | fp16 或 bf16(30系以上推荐bf16) |
| $cache_latents | 缓存潜变量 | 将图片预处理为潜变量并缓存,加速后续Epoch | 1 (开启)(建议首次训练开启) |
| $enable_bucket | 启用分桶 | 对不同分辨率的图片进行分组处理,无需裁剪 | 1 (开启)(极度推荐) |
| $enable_lycoris | 启用LyCORIS | 开启更高级的LoRA变体(如LoKr, LoHa)训练 | 0 (关闭)(目前疑似不支持) |
| $enable_block_weights | 启用分层训练 | 为U-Net的不同层级设置不同的学习率 | 0 (关闭) |
| $shuffle_caption | 打乱标签 | 随机打乱caption中的token顺序 | 1 (开启) |
| $keep_tokens | 保留前N个token | 打乱时保留开头的N个词组不参与打乱 | 根据需要设置 |
| $prior_loss_weight | 正则化权重 | 正则化损失的权重,用于平衡正则图片和训练图 | 1 |
| $caption_prefix | 标签前缀 | 为所有图片的标签统一添加前缀,如质量词 | masterpiece, best quality, |
| $caption_suffix | 标签后缀 | 为所有图片的标签统一添加后缀,如镜头视角 | full body, |