Ebook2Audiobook 是一款于 2024 年开源的工具,旨在将电子书 (eBooks) 转换为有声书 (audiobooks) 。该项目利用先进的文本到语音 (Text-to-Speech, TTS) 技术,将电子书中的文本内容自动转换为语音,生成可供用户收听的有声书。 Ebook2Audiobook 支持多种电子书格式,如 EPUB 、 PDF 、 MOBI 等,并能够保留章节结构和元数据,使生成的有声书更加易于导航和理解。

软件图片

Ebook2Audiobook 电子书转有声读物 v25.6.9

软件特色

📖 使用 Calibre 将电子书转换为文本格式。
📚将 eBooks 分割为章节,以组织音频。
🎙️使用 Coqui XTTSv2 和 Fairseq 的高质量文本转语音。
🗣️可选的语音克隆,使用你自己的语音文件。
🌍支持 1107 种语言(默认为英语)

软件教程

该项目存在「模型加载过程」,大约需要 3-4 分钟;
进度条生成完成后,如在线显示音频无法显示,请刷新网页,也可下载到本地进行查看;
使用 txt 文档时,只会读取第一行;
一定要注意电子书的语言必须要和所选语言一致,不然会生成一段「非人类语言」;
本项目中 Fine Tuned Models 只缓存了 std 模型。
  1. 下载程序解压到电脑上,注意文件夹不要有中文
  2. 双击运行解压的 ebook2audiobook.cmd 文件

Ebook2Audiobook 电子书转有声读物 v25.6.9
Ebook2Audiobook 电子书转有声读物 v25.6.9

生成参数说明如下:

  • Temperature 0.65

    • 较高值生成更具创意和不可预测的输出,较低值使输出更单调。
  • Length Penalty:惩罚较长序列

    • 较高值生成较短的输出(不适用于自定义模型)。
  • Repetition Penalty:惩罚重复短语

    • 较高值减少重复。
  • Top-k Sampling:较低值限制输出为更可能的单词,加快音频生成速度。
  • Top-p Sampling:控制单词选择的累积概率

    • 较低值使输出更可预测,加快音频生成速度。
  • Narrator Speed:调整叙述者的语速。
  • Text Splitting:将长文本拆分为句子以分块生成音频。

    • 适用于非常长的输入。
  • Enable Text Splitting:启用文本拆分。

Ebook2Audiobook 电子书转有声读物 v25.6.9

版本日志

软件下载

开源地址:https://github.com/DrewThomasson/ebook2audiobook
夸克网盘:https://pan.quark.cn/s/a10085cf8a5c
本地下载

网盘空间不够的可以参考下面的方法获取更多空间

夸克网盘空间获取:https://pan.quark.cn/s/45c661cbed7e

夸克网盘空间获取

标签: AI工具

相关推荐

添加新评论,含*的栏目为必填