AI 有声书自动化生成工具
这个AI有声书自动化生成工具是一个基于大模型(Gemini, CosyVoice2-0.5B)的解决方案,旨在将文本小说自动转化为有声书。它利用Python编写,需要一定的环境配置(Python 3.10+, API Key, ffmpeg, 可选mongodb)。
核心功能包括:
- 小说爬取: 从小说网站抓取小说内容。
- 章节处理: 获取小说章节列表和每章内容,并保存。
- AI对话信息处理: 利用AI识别章节中的对话,区分角色,为后续分配音频做准备。
- 角色声音配置: 创建角色模型选择表,指定主角和旁白声音,其他角色则随机分配或使用旁白声音。
- 音频生成: 使用多线程技术生成音频文件。
- 辅助工具: 提供API Key批量测试,音频文件排序,喜马拉雅作品批量删除管理,以及小说爬取管理等工具。
使用场景:
- 个人有声书制作: 将自己喜欢的小说转化为有声书,随时随地收听。
- 批量有声书生产: 用于商业用途,例如快速批量生成有声书上传至喜马拉雅等平台。
- 解放劳动力: 降低有声书制作成本,无需人工配音,只需进行少量的人工干预。
- 内容创作与实验: 用于AI语音合成和内容创作方面的研究与实验。
总而言之,该工具旨在通过自动化流程和AI技术,简化有声书制作过程,降低成本,提高效率。