首先,使用右上角橙色的按钮启动并进入一个工作区,在其中完成以下文件的上传/修改,它们在后续按钮一键启动时会传入到对应文件夹。
- input/sd-models
- 放入你想要训练的底模。在启动时,会自带一个noobvpred1的底模,我自己也上传了一个wai vpred2,noob的文件名如/input/mylora.toml内所示
- input/config
- mylora.toml:修改你的训练配置,wandbtoken会在后续一键启动时要求输入,不过这个好像不稳定,在你fork后可以自己写入也行。
- sample_prompts:修改你的预览图提示词
- input/train
- 上传你的训练集(zip)。目录格式应该是/name/n_name/*.jpg
- 你熟悉的话怎么样都行
- 按钮写入了一个传入zip密码的逻辑,若你的zip有密码,就填写,没有,就不填。
- 如果你有多个压缩包,你需要保持它们的密码都相同
- input/output
- 平台会在大约1.5h掐断训练,届时训练脚本对应的output下内容会自动备份至此。
- 启用save_state参数,可以利用这个在你的下次训练进行续练
- 该目录下所有文件在启动时会传入训练脚本下的/state文件夹,对于调用,应基于此文件夹。
完成上述上传后之后记得去到云原生构建关闭这个工作区,然后进行下一步:
- 使用
git add .
git commit -m "<你想要标识的上传内容>"
git push
把你的训练内容推送到仓库.如果你待上传的文件大于50mb,在add之前加上git lfs track /path/to/yourfiles
- 然后回到仓库页面,点击最上方的“构建”按钮,下拉后的按钮,输入内容后就可以启动了
- 你可以使用右上角头像-我的云原生开发-第一个“运行中”里面的webide按钮来进入跟上述同样的工作区。在这里,你可以:
- 打开job_run.log来监控你当前的部署/训练输出
- 同样可以进行数据集的传入和推送操作,虽然我建议你在训练停止后再操作。
- 在训练停止/被掐之后,这个工作区若无任何操作,在10分钟后才会关闭,如果你一直在此页面,就不会关闭,届时你可以:
- 重新启动训练(这样没有备份,而且因为缓存没清,导致速度很慢,不建议)
- 传入你下一次的训练内容到input并推送
- 下载/备份你的输出模型到本地
出现问题可以提issue或直接找到我,这个项目不保证第一次就能正常使用,因为我很少在这里修改。