logo
0
0
Login

点击右上角 Fork 按钮加入到自己的仓库,然后点击 启动云原生开发 按钮,项目启动后右下角弹框点击 Open in Browser 跳转到新的界面即可使用。

项目默认只启动前端推理页面,需要启动训练页面可以手动执行 scripts 目录下的 start-train.sh 脚本。

命令行推理

# Run with flags # Leave --ref_text "" will have ASR model transcribe (extra GPU memory usage) f5-tts_infer-cli --model F5TTS_v1_Base \ --ref_audio "provide_prompt_wav_path_here.wav" \ --ref_text "The content, subtitle or transcription of reference audio." \ --gen_text "Some text you want TTS model generate for you." # Run with default setting. src/f5_tts/infer/examples/basic/basic.toml f5-tts_infer-cli # Or with your own .toml file f5-tts_infer-cli -c custom.toml # Multi voice. See src/f5_tts/infer/README.md f5-tts_infer-cli -c src/f5_tts/infer/examples/multi/story.toml
参数说明
  • –model: 指定推理模型 F5TTS_v1_BaseF5TTS_BaseE2TTS_Base 等。
  • –ref_audio: 待克隆的音频。
  • –ref_text: 待克隆的音频对应的文本,如果不提供会默认下载 openai/whisper-large-v3-turbo 进行语音识别。
  • –gen_text: 需要合成的文本。
  • -c: 指定推理配置文件。

About

文本转语音,声音克隆

文本转语音声音克隆
F5-TTSsame-named
Language
Shell47.9%
Dockerfile26.5%
Markdown25.6%