OpenAudio 语音生成及声音克隆工具一键启动包 v1.5.1
Fish Audio 开源其全新文本转语音(TTS)模型 OpenAudio S1-Mini,OpenAudio S1-Mini 是从4B 参数的 S1模型蒸馏而来的轻量化版本,仅包含0.5B 参数,大幅降低计算需求,同时保留了 S1的核心优势,基于超过200万小时的庞大音频数据集训练,支持14种语言(包括中文、英文、日语、法语等),并能生成超过50种情感和语调的语音表达。无论是愤怒、开心、惊讶,还是笑声、哭声等特殊音效。
软件图片
软件特色
高度自然的声音: 生成的声音流畅、逼真,几乎与人类配音无异,适用于专业场景如视频配音、播客和游戏角色语音。
丰富的语气控制: 支持超过50种情绪和语气标记,如(愤怒)、(高兴)、(悲伤)、(低语)、(同情)等,用户可通过自然语言指令灵活调整语音表达。
强大的指令跟随能力: 通过简单的文本指令,用户可以控制语音的语速、音量、停顿甚至笑声等细节,打造高度个性化的语音输出。
多语言支持: 得益于200万小时的音频训练数据,OpenAudio S1在语音生成的质量和多样性上取得了显著突破,覆盖英语、中文、日语、韩语、法语、德语、阿拉伯语、西班牙语等13种语言,展现了强大的多语言能力。
配置要求
操作系统:Windows 10/11 64位
内存:16G以上
显卡:至少8G及以上显存的英伟达(NVIDIA)显卡
CUDA:显卡支持的CUDA版本大于等于12.8版本
整个包解压完约10.9G,要留足硬盘空间
注意:文件夹路径和文件名称(包括音频、图片、视频等文件名称)不要出现中文字符,否则部分软件会因识别不出而报错
下方是官方给出的一些情绪及音调控制提示词,可自行尝试效果
基本情绪:
(angry) (sad) (excited) (surprised) (satisfied) (delighted) (scared) (worried) (upset) (nervous) (frustrated) (depressed) (empathetic) (embarrassed) (disgusted) (moved) (proud) (relaxed) (grateful) (confident) (interested) (curious) (confused) (joyful)
高级情绪:
(disdainful) (unhappy) (anxious) (hysterical) (indifferent) (impatient) (guilty) (scornful) (panicked) (furious) (reluctant) (keen) (disapproving) (negative) (denying) (astonished) (serious) (sarcastic) (conciliative) (comforting) (sincere) (sneering) (hesitating) (yielding) (painful) (awkward) (amused)
声调标记:
(in a hurry tone) (shouting) (screaming) (whispering) (soft tone)
特殊音效:
(laughing) (chuckling) (sobbing) (crying loudly) (sighing) (panting) (groaning) (crowd laughing) (background laughter) (audience laughing)
版本日志
软件下载
开源地址:https://github.com/fishaudio/fish-speech
夸克网盘:https://pan.quark.cn/s/2e07865555b9
百度网盘:https://pan.baidu.com/s/1HNDy4KCBZtpGmq6Sh3mJ3w?pwd=hags 提取码: hags
本地下载
网盘空间不够的可以参考下面的方法获取更多空间
夸克网盘空间获取:https://pan.quark.cn/s/45c661cbed7e