CosyVoice 是由阿里研发开源的一款集多功能声音克隆软件。无需繁琐的模型训练流程,仅需短短 3 - 10 秒的音频片段,就能精准实现 90% 以上的高相似度克隆效果,并且全面支持中文语气指令操控,完美复刻饱含情感的声音。

大家也可能感兴趣:GPT SoVITS WebUI 基于AI学习训练的声音克隆工具

软件图片

10-24122H0434K47.png

软件特色

卓越的语音合成功能:能够将输入的各类文案内容,以自然流畅、毫无违和感的方式转化为高品质的音频语音格式,让每一个字符都灵动发声。

多语种及方言克隆:无论是国际通用的中文普通话、英文、日文、韩文,还是极具地域特色的粤语、四川话、上海话、天津话、武汉话等等,通通不在话下,轻松克隆。

精准指令情感控制:凭借简洁易懂的中文指令,对语音的情感基调、语气轻重等细微之处进行全方位把控。例如,下达 “用英文朗读这句话,音色高亢嘹亮,情绪快乐饱满,语速稍快一些” 的指令,便能即刻得到符合要求的生动语音。

高效免训练克隆机制:只需提供一段时长 3 - 10 秒、纯净无杂音的目标说话人样本音频,即可迅速开启克隆之旅,大大节省时间与精力。

应用场景

短视频创作中的生动配音、专业解说,有声书领域的精彩制作,为亲友留存独一无二声音印记的复刻服务,以及宣传片高大上的配音制作等,CosyVoice 都能完美驾驭。

配置要求

Windows 系统:
20 系 N 系显卡,显存 6G 及以上,运行 win10 或 win11 系统。
30 系 N 系显卡,显存 4G 及以上,搭配 win10 或 win11 系统。

Mac 电脑:
需搭载 M 系列 CPU 芯片,且安装 macos 系统 14 及以上版本。

版本日志

软件下载

不要放在中文文件夹,不要放在中文路径下

夸克网盘:https://pan.quark.cn/s/606577339ae6
本地下载

CosyVoice开源地址:https://github.com/FunAudioLLM/CosyVoice

标签: AI工具

相关推荐

添加新评论,含*的栏目为必填