logo
Login
multimedia
multimedia
多媒体仓库
音频,视频等处理仓库
Recent updates
DeepBeepMeep 的 WanGP:GPU 可访问的最佳开源视频生成模型,WanGP 支持Wan(及衍生模型)、混元视频和 LTV 视频模型
Shell
0000
项目来源:https://github.com/Soul-AILab/SoulX-Podcast SoulX-Podcast 专为播客式多轮、多说话人对话语音生成而设计,同时在常规独白 TTS 任务中也能实现卓越的性能。 为了满足多轮口语对话对自然度的更高要求,SoulX-Podcast 集成了一系列副语言控制,支持普通话和英语,以及多种中国方言,包括四川话、河南话和粤语,从而实现更个性化的播客风格语音生成。
Shell
2600