CosyVoice2 功能扩充(预训练音色/3s极速复刻/自然语言控制/自动识别/音色保存/API),支持 Windows / Linux / MacOS
Demo: Modelscope
[!NOTE] 首次运行会自动下载约 10G 左右的模型文件,也可以自行下载模型文件,放置于
pretrained_models目录下
提供有 Windows 可用的一键包,解压后双击打开 运行-CosyVoice2-Ex.bat 即可运行
在 MacBook Pro(M4 Pro) 和 WSL2 Ubuntu 22.04 部署运行测试通过
须通过 conda 环境运行,参考 https://docs.conda.io/en/latest/miniconda.html
conda create -n cosyvoice -y python=3.10 conda activate cosyvoice conda install -y -c conda-forge pynini==2.1.5 pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com python webui.py --port 8080 --open
Linux 可安装 ttsfrd 提升文本归一化性能(可选)
sudo apt-get install -y git build-essential curl wget ffmpeg unzip git git-lfs sox libsox-dev nvidia-cuda-toolkit
git lfs install
git clone https://www.modelscope.cn/iic/CosyVoice-ttsfrd.git pretrained_models/CosyVoice-ttsfrd
cd pretrained_models/CosyVoice-ttsfrd/
unzip resource.zip -d .
pip install ttsfrd-0.3.6-cp38-cp38-linux_x86_64.whl
python api.py http://localhost:9880/?text=春日清晨,老街深处飘来阵阵豆香。三代传承的手艺,将金黄的豆浆熬制成最纯粹的味道。一碗温热的豆腐脑,不仅是早餐,更是儿时难忘的记忆,是岁月沉淀的生活智慧。&speaker=舌尖上的中国 http://localhost:9880/?text=hello%20hello~%20[breath]%20听得到吗?%20きこえていますか?%20初次见面,请多关照呀!%20这里是嘉然Diana,大家也可以叫我<strong>蒂娜</strong>%20是你们最甜甜甜的小草莓&speaker=嘉然&instruct=慢速,用可爱的语气说
本项目仅用于学习、研究和技术交流目的。使用者必须遵守中华人民共和国相关法律法规,尊重他人知识产权和合法权益。
本项目基于 Apache 2.0 协议开源
关于项目中的音频素材:
关于 AI 生成语音:
严禁将本项目用于以下用途:
使用限制:
使用本项目所产生的一切后果由使用者自行承担,项目开发者不承担任何法律责任
如果本项目有任何侵犯您权益的地方,请及时联系我们,我们将立即处理
使用本项目即表示您已阅读并同意以上声明