开源AI声音克隆程序GPT-SoVITS本地运行教程 | AI声音克隆教程

zhaolou • 2024年8月16日上午8:00 • AI, AI声音 • 阅读 2868

GPT-SoVITS是目前为止我亲测过的效果最好的 AI声音克隆程序，我甚至已经用这个程序克隆的声音做了一期完整的视频！相比较于《VALL-E X多语言文本到语音合成与语音克隆windows10本地部署教程》，GPT-SoVITS克隆的声音更加稳定，连贯性更好，下面我就来具体讲解下GPT-SoVITS在本地部署和运行的详细步骤！

Table of Contents

GPT-SoVITS功能
效果展示
安装方法
使用方法
训练模型
人声伴奏分离&去混响（可选）
人声分离步骤
效果展示
语音切割（必选）
语音文本校对标注（可选）
训练集格式化（必选）
微调训练（必选）
推理
效果展示
GPT-SoVITS功能
零样本文本到语音（ TTS）：输入 5 秒的声音样本，即刻体验文本到语音转换。

少样本 TTS：仅需 1 分钟的训练数据即可微调模型，提升声音相似度和真实感。

跨语言支持：支持与训练数据集不同语言的推理，目前支持英语、日语和中文。

WebUI 工具：集成工具包括声音伴奏分离、自动训练集分割、中文自动语音识别( ASR)和文本标注，协助初学者创建训练数据集和 GPT/SoVITS 模型。

GPT-SoVITS的github主页：https://github.com/RVC-Boss/GPT-SoVITS

GPT-SoVITS的huggingface下载地址：https://huggingface.co/lj1995/GPT-SoVITS-windows-package/tree/main

如果你无法访问huggingface，可以点击下面的代理链接下载：

GPT-SoVITS-beta.7z

GPT-SoVITS-beta0207.7z

压缩包下载到本地后，解压到你自己选择的位置即可！双击“go-webui.bat”即可用运行“GPT-SoVITS”程序！