IndexTTS是由哔哩哔哩(B站)推出的开源文本转语音(TTS)系统,专为优化中文语音合成设计,具备拼音纠错、多音字消歧和精准停顿控制等核心功能。该系统在字词错误率(WER)和音质评测(MOS)等指标上显著优于同类模型,已成为中文语音合成领域的新标杆‌。‌‌‌‌

软件图片

IndexTTS 逼真的Ai声音克隆神器 一键启动包 v3

软件特色

亲测效果逼真,且转换速度比较快(300多字,50多S,3060显卡)
对复杂文字的阅读流畅度和克隆声音的逼真度要超过 CosyVoice2
使用简单,无需部署,打开即可使用(注意,文件夹及路径必须全英文才可以运行)
完全免费,本地运行,永久免费使用

使用教程

IndexTTS 使用教程如下,建议使用 N 卡,显存 4G 起,支持 50 系显卡,基于 CUDA 12.8

IndexTTS 逼真的Ai声音克隆神器 一键启动包 v3

步骤 1:上传参考音频
上传参考音频以帮助模型更好地生成语音。

步骤 2:输入文本
在文本输入框中输入需要转换为语音的文本内容。

步骤 3:生成语音
根据文本长度选择“普通推理”和“批次推理”。实测“批次推理”充分利用显存,生成速度提升 10 倍以上,但稳定性略逊于“普通推理”。大家可以根据需要自行调整。

版本日志

软件下载

夸克网盘:https://pan.quark.cn/s/54777e6f000a
迅雷网盘:https://pan.xunlei.com/s/VOSP4EL_99cSiDuhiJnKgv6HA1?pwd=77a4#
本地下载
开源地址:https://github.com/index-tts/index-tts

网盘空间不够的可以参考下面的方法获取更多空间

夸克网盘空间获取:https://pan.quark.cn/s/45c661cbed7e

夸克网盘空间获取

标签: AI工具

相关推荐

添加新评论,含*的栏目为必填