首页 服务器租用 小白工具箱 社区 免费注册

AI文字转语音TTS

AI开源项目 AI开源项目AI朗读AI视频配音TTS文字转语音
AI文字转语音TTS
资源说明

Kokoro TTS 是目前最受关注的开源文本转语音项目之一,基于 hexgrad 开发的 Kokoro-82M 模型,GitHub 地址:https://github.com/nazdridoy/kokoro-tts,拥有 1.3k Star。

这个项目最大的亮点在于其极高的性价比。仅用 8200 万参数就能实现接近真人的语音效果,生成的英语发音自然流畅、情感丰富,相比动辄几十亿参数的商业 TTS 模型,Kokoro 在保证质量的同时大幅降低了计算资源需求。模型于 2024 年底开源,采用 Apache 2.0 许可证,完全免费可商用。

在音色支持方面,Kokoro TTS 提供了丰富的选择,共支持 28 种音色,涵盖多种语言:美式英语(包括 11 种女声和 8 种男声)、英式英语、中文(包含多种方言音色)、法语、意大利语、日语等。用户不仅可以单独选择某一种音色,还能通过 Voice Blending 功能混合多个音色,通过调节不同音色的权重比例,创造出独一无二的个性化声音。比如可以将 af_sarah:60 和 am_adam:40 混合,制作出兼具温柔与沉稳的独特音色。

输入输出方面,Kokoro TTS 表现出极强的灵活性。支持 TXT 纯文本、PDF 文档、EPUB 电子书等多种输入格式,可以直接朗读整本厚重的书籍,对于有声书制作者来说非常友好。输出格式支持 WAV、MP3、AAC 等主流音频格式。用户还可以在命令行中通过管道符直接处理其他程序的输出,实现自动化工作流。

使用体验上,该项目提供了两种界面选择:对于技术用户,可以使用简洁高效的 CLI 命令行界面;对于非技术用户,可以使用 Gradio 网页界面,通过浏览器点击操作即可完成语音合成。语速调节范围为 0.1 到 3.0 倍速,可以根据需要调整语速快慢。

安装部署也非常简单,支持 pip 和 uv 两种安装方式,一行命令即可完成安装。项目还提供了 Windows 一键启动整合包,无需配置 Python 环境,下载解压即可使用,对新手用户非常友好。

Kokoro TTS 的应用场景非常广泛:可以用于 AI 视频解说配音,生成自然流畅的英语旁白;制作有声书,将 PDF 或 EPUB 电子书自动转为语音版本;为游戏角色配音;制作播客内容;以及各种需要语音合成的创意项目。由于其开源免费且效果出色的特点,已经成为众多 AI 视频生成工具的首选配音方案,如 MoneyPrinterTurbo 等项目都已集成 Kokoro TTS 作为语音引擎。

相关资源
AI影视解说
AI影视解说
NarratoAI 是一款基于大语言模型的开源视频创作工具,只需上传视频,就能自动生成解说文案、剪辑视频、配音并添加字幕,一站式完成影视解说视频制作。该工具支持 GPT-4、Gemini、DeepSeek、Qwen 等多种 AI 模型,可接入 OpenAI、SiliconFlow、OpenRouter 等网关服务,内置多种配音模式,并支持 IndexTTS 语音克隆功能,让配音更加自然逼真。NarratoAI 部署简单,支持 Docker 和 Windows 整合包,配置要求低,4核CPU、8G内存即可运行,显卡非必须,剪辑10分钟视频成本仅约0.1元,非常适合需要批量生产视频的内容创作者。
AI开源项目影视解说短视频
AI视频音效配音
AI视频音效配音
该工具可根据输入的视频和文本,自动生成与之同步的高质量音频。用户上传无声视频后,系统会智能分析画面内容——人物动作、物体运动、场景环境等,生成时间同步、逻辑匹配的音效或背景音乐。支持视频转音频、文本转音频、图文联合引导三种生成模式。技术层面采用多模态联合训练框架,通过条件同步模块确保音画精确对齐,生成 8 秒音频仅需 1.23 秒,模型最小仅 157M 参数,在音频质量和同步性方面达到开源最高水平。完全免费,支持命令行和 Gradio 界面,可用于为 AI 视频配音、游戏音效制作、影视音轨生成等场景。
AI开源项目AI视频配乐AI视频配音
AI超分辨率工具
AI超分辨率工具
图像修复领域最受欢迎的开源项目之一。该工具的核心功能是将低分辨率、模糊的图像提升为高清图像。与传统算法假设的理想下采样不同,RealESRGAN 专门针对现实世界中复杂多样的图像退化进行训练,能够处理模糊、噪点、JPEG 压缩伪影等多种退化问题。无论是老照片修复、动漫图片增强还是视频画质提升,都能获得出色的效果。RealESRGAN 基于 GAN 架构,主要创新包括高阶退化建模、sinc 滤波器抑制振铃伪影、频谱归一化 U-Net 判别器等。提供多种预训练模型:通用模型、动漫专用模型、动漫视频模型等,还支持 GFPGAN 人脸增强。使用便捷,提供 Python 脚本、便携式可执行文件和在线 Demo 三种方式。便携版无需安装环境,下载后直接运行即可。广泛应用于老照片修复、短视频画质提升、动漫图片增强、游戏素材高清化等场景。
AI开源项目AI超分画质修补
AI一键生成高清短视频
AI一键生成高清短视频
输入视频主题或关键词,全自动生成文案、素材、字幕、背景音乐并合成高清短视频。
AI开源项目短视频视频生成
AI视频换脸工具
AI视频换脸工具
roop/rope/facefusion 换脸工具整合包:无需环境配置,解压即用(仅供学习交流)。
AI开源项目AI换脸视频换脸
金牌服务
外贸独立站
外贸独立站
让世界见证您的好产品,告别平台抽成,开启品牌出海新篇~
建站独立站外贸多语言中英文网站
安卓App开发
安卓App开发
从0到1交付安卓应用:原型设计、UI、客户端开发、后端接口、消息推送、支付登录、上架与运维。你只管业务,我们负责把产品落地。
安卓APP开发
脚本定制
脚本定制
专门配置硬件、安装运行环境并部署定制化脚本(如数据采集、自动化运维、游戏多开等脚本)的服务器,让你无需自己搭建和维护环境,即买即用。
脚本运维定制
TG机器人开发
TG机器人开发
开发自动回复、群管、通知推送或交易工具等功能的机器人程序,并负责部署和维护的技术服务。
自动化机器人定制开发消息推送