在Intel或Apple Silicon Mac上本地运行GPT-SoVITS推理

简介

“GPT-SoVITS"的GitHub仓库是一个专注于语音数据处理和文本转语音（TTS）技术的项目。它突出了使用仅一分钟语音数据就能训练出良好TTS模型的能力，这种方法被称为"少样本语音克隆”。该项目采用MIT许可证，主要使用Python编程语言。

重要提示： 本教程已过期，项目已支持MAC，请按照GitHub的教程进行操作。

本教程将讨论如何在Mac平台上使用CPU运行此项目。

MPS不支持

项目链接：https://github.com/RVC-Boss/GPT-SoVITS

本教程仅供交流学习使用。请勿用于非法、不道德或不道德的目的。

请确保您自行解决与数据集相关的任何授权问题。对于使用未经授权的数据集进行训练而产生的任何问题以及由此产生的后果，您需承担全部责任。仓库及其维护者、svc开发团队不承担任何相关责任。

严禁将其用于任何政治相关目的。

软件要求：

1	brew install python3.9

创建一个虚拟环境

1	python3.9 -m venv myenv #将'myenv'改为其他名称

cd myenv

1	source bin/activate

1	git clone https://github.com/RVC-Boss/GPT-SoVITS.git

使用cd进入项目目录

1	brew install ffmpeg

1	pip install torch numpy scipy tensorboard librosa==0.9.2 numba==0.56.4 pytorch-lightning gradio==3.14.0 ffmpeg-python onnxruntime tqdm cn2an pypinyin pyopenjtalk g2p_en chardet

额外要求

如果您需要中文ASR（由FunASR支持），请安装：

1	pip install modelscope torchaudio sentencepiece funasr

注意：如果您发现No module named，只需安装该包即可

~~您也可以使用requirements.txt来安装，但如果有问题，只需安装我之前提到的内容。~~

1	pip install -r requirements.txt # 不需要运行这个

从GPT-SoVITS Models下载预训练模型并将它们放在GPT_SoVITS/pretrained_models中。

对于中文ASR（额外），从Damo ASR Model、Damo VAD Model和Damo Punc Model下载模型，并将它们放在tools/damo_asr/models中。

对于UVR5（人声/伴奏分离和混响去除，额外），从UVR5 Weights下载模型并将它们放在tools/uvr5/uvr5_weights中。

1	python web.py

模型在这两个文件夹中，一个是GPT模型，另一个是SoVITS模型。您应该将文件放到正确的文件夹中

点击是否开启TTS推理WebUI

此时可能会报错。
您需要修改GPT_SoVITS/inference_webui.py以使用CPU推理。

├── GPT_weights
   └── LeiJun-e15.ckpt
├── SoVITS_weights
  └── LeiJun_e10_s470.pth

只需保存更改并重新运行即可。

感谢阅读。如果教程中有任何问题或更好的方法，请指出。