项目来源:https://github.com/Soul-AILab/SoulX-Podcast SoulX-Podcast 专为播客式多轮、多说话人对话语音生成而设计,同时在常规独白 TTS 任务中也能实现卓越的性能。 为了满足多轮口语对话对自然度的更高要求,SoulX-Podcast 集成了一系列副语言控制,支持普通话和英语,以及多种中国方言,包括四川话、河南话和粤语,从而实现更个性化的播客风格语音生成。