logo
0
0
Login
Forkfromhanpi2233/lora-train-newnew, ahead:main7 commits, behind:main7 commits

使用cnb平台一键启动训练

首先,使用右上角橙色的按钮启动并进入一个工作区,在其中完成以下文件的上传/修改,它们在后续按钮一键启动时会传入到对应文件夹。

你当然也可以直接在工作区训练,环境是完整的

强烈建议不熟悉训练的人先不要使用这个一键训练版本

  1. input/sd-models
    • 放入你想要训练的底模。在启动时,会自带一个noobvpred1的底模,我自己也上传了一个wai vpred2,noob的文件名如/input/mylora.toml内所示
  2. input/config
    • mylora.toml:修改你的训练配置,wandbtoken会在后续一键启动时要求输入,不过这个好像不稳定,在你fork后可以自己写入也行。
    • sample_prompts:修改你的预览图提示词
  3. input/train
    • 上传你的训练集(zip)。目录格式应该是/name/n_name/*.jpg
    • 你熟悉的话怎么样都行
    • 按钮写入了一个传入zip密码的逻辑,若你的zip有密码,就填写,没有,就不填。
    • 如果你有多个压缩包,你需要保持它们的密码都相同
  4. input/output
    • 平台会在大约1.5h掐断训练,届时训练脚本对应的output下内容会自动备份至此。
    • 启用save_state参数,可以利用这个在你的下次训练进行续练
    • 该目录下所有文件在启动时会传入训练脚本下的/state文件夹,对于调用,应基于此文件夹。

完成上述上传后之后记得去到云原生构建关闭这个工作区,然后进行下一步:

  1. 使用
git add . git commit -m "<你想要标识的上传内容>" git push

把你的训练内容推送到仓库.如果你待上传的文件大于50mb,在add之前加上git lfs track /path/to/yourfiles

  1. 然后回到仓库页面,点击最上方的“构建”按钮,下拉后的按钮,输入内容后就可以启动了

训练途中

  • 你可以使用右上角头像-我的云原生开发-第一个“运行中”里面的webide按钮来进入跟上述同样的工作区。在这里,你可以:
    • 打开job_run.log来监控你当前的部署/训练输出
    • 同样可以进行数据集的传入和推送操作,虽然我建议你在训练停止后再操作。
    • 在训练停止/被掐之后,这个工作区若无任何操作,在10分钟后才会关闭,如果你一直在此页面,就不会关闭,届时你可以:
      • 重新启动训练(这样没有备份,而且因为缓存没清,导致速度很慢,不建议)
      • 传入你下一次的训练内容到input并推送
      • 下载/备份你的输出模型到本地

出现问题可以提issue或直接找到我,这个项目不保证第一次就能正常使用,因为我很少在这里修改。

About

No description, topics, or website provided.
Language
Python94.4%
Markdown2.5%
TypeScript0.8%
License0.5%
Others1.8%