Ebook2Audiobook 电子书转有声读物 v25.6.9
Ebook2Audiobook 是一款于 2024 年开源的工具,旨在将电子书 (eBooks) 转换为有声书 (audiobooks) 。该项目利用先进的文本到语音 (Text-to-Speech, TTS) 技术,将电子书中的文本内容自动转换为语音,生成可供用户收听的有声书。 Ebook2Audiobook 支持多种电子书格式,如 EPUB 、 PDF 、 MOBI 等,并能够保留章节结构和元数据,使生成的有声书更加易于导航和理解。
软件图片
软件特色
📖 使用 Calibre 将电子书转换为文本格式。
📚将 eBooks 分割为章节,以组织音频。
🎙️使用 Coqui XTTSv2 和 Fairseq 的高质量文本转语音。
🗣️可选的语音克隆,使用你自己的语音文件。
🌍支持 1107 种语言(默认为英语)
软件教程
该项目存在「模型加载过程」,大约需要 3-4 分钟;
进度条生成完成后,如在线显示音频无法显示,请刷新网页,也可下载到本地进行查看;
使用 txt 文档时,只会读取第一行;
一定要注意电子书的语言必须要和所选语言一致,不然会生成一段「非人类语言」;
本项目中 Fine Tuned Models 只缓存了 std 模型。
- 下载程序解压到电脑上,注意文件夹不要有中文
- 双击运行解压的
ebook2audiobook.cmd
文件
生成参数说明如下:
Temperature 0.65
- 较高值生成更具创意和不可预测的输出,较低值使输出更单调。
Length Penalty:惩罚较长序列
- 较高值生成较短的输出(不适用于自定义模型)。
Repetition Penalty:惩罚重复短语
- 较高值减少重复。
- Top-k Sampling:较低值限制输出为更可能的单词,加快音频生成速度。
Top-p Sampling:控制单词选择的累积概率
- 较低值使输出更可预测,加快音频生成速度。
- Narrator Speed:调整叙述者的语速。
Text Splitting:将长文本拆分为句子以分块生成音频。
- 适用于非常长的输入。
- Enable Text Splitting:启用文本拆分。
版本日志
软件下载
开源地址:https://github.com/DrewThomasson/ebook2audiobook
夸克网盘:https://pan.quark.cn/s/a10085cf8a5c
本地下载
网盘空间不够的可以参考下面的方法获取更多空间
夸克网盘空间获取:https://pan.quark.cn/s/45c661cbed7e