CosyVoice整合包 阿里开源的AI声音克隆软件 v2.2
CosyVoice 是由阿里研发开源的一款集多功能声音克隆软件。无需繁琐的模型训练流程,仅需短短 3 - 10 秒的音频片段,就能精准实现 90% 以上的高相似度克隆效果,并且全面支持中文语气指令操控,完美复刻饱含情感的声音。
大家也可能感兴趣:GPT SoVITS WebUI 基于AI学习训练的声音克隆工具
软件图片
软件特色
卓越的语音合成功能:能够将输入的各类文案内容,以自然流畅、毫无违和感的方式转化为高品质的音频语音格式,让每一个字符都灵动发声。
多语种及方言克隆:无论是国际通用的中文普通话、英文、日文、韩文,还是极具地域特色的粤语、四川话、上海话、天津话、武汉话等等,通通不在话下,轻松克隆。
精准指令情感控制:凭借简洁易懂的中文指令,对语音的情感基调、语气轻重等细微之处进行全方位把控。例如,下达 “用英文朗读这句话,音色高亢嘹亮,情绪快乐饱满,语速稍快一些” 的指令,便能即刻得到符合要求的生动语音。
高效免训练克隆机制:只需提供一段时长 3 - 10 秒、纯净无杂音的目标说话人样本音频,即可迅速开启克隆之旅,大大节省时间与精力。
应用场景
短视频创作中的生动配音、专业解说,有声书领域的精彩制作,为亲友留存独一无二声音印记的复刻服务,以及宣传片高大上的配音制作等,CosyVoice 都能完美驾驭。
配置要求
Windows 系统:
20 系 N 系显卡,显存 6G 及以上,运行 win10 或 win11 系统。
30 系 N 系显卡,显存 4G 及以上,搭配 win10 或 win11 系统。
Mac 电脑:
需搭载 M 系列 CPU 芯片,且安装 macos 系统 14 及以上版本。
版本日志
软件下载
不要放在中文文件夹,不要放在中文路径下
夸克网盘:https://pan.quark.cn/s/606577339ae6
本地下载
CosyVoice开源地址:https://github.com/FunAudioLLM/CosyVoice