开源AI声音克隆程序GPT-SoVITS本地运行教程 | AI声音克隆教程

GPT-SoVITS是目前为止我亲测过的效果最好的 AI声音克隆程序,我甚至已经用这个程序克隆的声音做了一期完整的视频!相比较于《VALL-E X多语言文本到语音合成与语音克隆windows10本地部署教程》,GPT-SoVITS克隆的声音更加稳定,连贯性更好,下面我就来具体讲解下GPT-SoVITS在本地部署和运行的详细步骤!

Table of Contents

GPT-SoVITS功能
效果展示
安装方法
使用方法
训练模型
人声伴奏分离&去混响(可选)
人声分离步骤
效果展示
语音切割(必选)
语音文本校对标注(可选)
训练集格式化(必选)
微调训练(必选)
推理
效果展示
GPT-SoVITS功能
零样本文本到语音( TTS): 输入 5 秒的声音样本,即刻体验文本到语音转换。

少样本 TTS: 仅需 1 分钟的训练数据即可微调模型,提升声音相似度和真实感。

跨语言支持: 支持与训练数据集不同语言的推理,目前支持英语、日语和中文。

WebUI 工具: 集成工具包括声音伴奏分离、自动训练集分割、中文自动 语音识别( ASR)和文本标注,协助初学者创建训练数据集和 GPT/SoVITS 模型。

GPT-SoVITS的github主页:https://github.com/RVC-Boss/GPT-SoVITS

GPT-SoVITS的huggingface下载地址:https://huggingface.co/lj1995/GPT-SoVITS-windows-package/tree/main

如果你无法访问huggingface,可以点击下面的代理链接下载:

GPT-SoVITS-beta.7z

GPT-SoVITS-beta0207.7z


压缩包下载到本地后,解压到你自己选择的位置即可!双击“go-webui.bat”即可用运行“GPT-SoVITS”程序!

开源AI声音克隆程序GPT-SoVITS本地运行教程 | AI声音克隆教程

使用方法

训练模型

程序的使用分为几个步骤,当然根据自己的实际情况,其中有些步骤并非必须的!

人声伴奏分离&去混响(可选)

这个步骤并非是必须的步骤,如果你的音频文件中没有背景音乐或者其他伴奏,你可以跳过该步骤!该步骤可以将你的音频文件中的纯人声单独分离出来,以便于后面的使用!

人声分离步骤

一、点选“是否开启UVR5-WebUI”,会自动弹出一个新的页面;

二、在新的页面中指定音频文件(可以指定包含1个或者多个音频文件的文件夹,也可以直接将音频文件拖入,2种方式二选一);

三、建议选择“HP5_only_main_vocal”模型,输出的路径可以修改为你自己指定的路径,也可以保持默认的路径,导出文件格式建议选择wav;

四、点击转换之后,会在设置的文件夹中生成2个音频文件,名称较短的那个就是纯人声的音频;


GPT-SoVITS

GPT-SoVITS

GPT-SoVITS

GPT-SoVITS
GPT-SoVITS
视频教程:十分钟手把手教会你用AI克隆自己的声音 | GPT-SoVITS教程

主题测试文章,只做测试使用。发布者:zhaolou,转转请注明出处:https://www.zhaolou.cc/archives/13

(0)
zhaolou's avatarzhaolou
上一篇 2025年4月4日 上午10:11
下一篇 2024年8月17日 上午8:32

相关推荐

  • AI提示词-夜晚农村场景

    场景1:乡村夜晚,明月与云朵点缀夜空,老旧房屋旁的院落铺满干草,几人在门口劳作,周边堆放杂物,背景树木环绕,营造质朴的乡村夜间劳作氛围。 场景2:现实乡村田园场景,小径贯穿菜园,鸡群漫步其间,卷心菜、花菜等蔬菜生机盎然,搭配黄色郁金香与橙色花卉,中央是开满白花的树木,远处房屋烟囱冒烟,背景环绕葱郁树林,营造自然清新的田园氛围。 场景3:夕阳余晖下,一对老年夫…

    2025年3月14日
    1.1K00
  • Midjourney-IP提示词-Pixar style

    A white cat with a red mask on its head, the cat’s ears are yellow,its head and tail are also yellow, its eyes are big, it is wearing blueclothes made of waterproof fabric, i…

    2025年4月4日
    87100
  • AI百宝箱-AI图片处理-AI绘图-AI视频-AI音频-AI数字人-AI漫画生成工具

    Ai设计/图片处理 老照片修复 相似图像生成 超快速抠图 创新艺术字生成 FaceChain-FACT人物写真生成 AI人像多风格漫画 Nolibox(商品图) Mokker(商品图) 丹青-千变万换 图像转绘 Flair(商品图) 人像抠图换背景 PhotoStudio(模特图) Pebblely(商品图) AI绘图 Midjourney 快手可图 阿里堆…

    AI 2024年8月17日
    2.6K00
  • Midjourney-IP提示词-Blind box style

    Blind box style, realistic PVC texture, exquisite Tusterchibi,super cute grinning 5-year-old, Singer, Glittering skirt, Thebackground is the stage, Green hair, Microphone, Full bod…

    2025年4月4日
    87400
  • Midjourney-IP提示词-Super cute kitten IP with cat

    Super cute kitten IP with cat ears shaped chef hat cuteEIDOexpression happy smile wearing waiter white orange uniformchest with dried fish sign Japanese cuisine display casebackgro…

    2025年4月4日
    95400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

在线咨询: QQ交谈

邮件:156738051@qq.com

工作时间:周一至周五,9:00-18:00,节假日休息

关注微信