使用 Docker 部署 Kokoro-FastAPI

注意

本教程来自社区贡献，并非 Open WebUI 官方支持内容。它仅作为演示，说明如何按你的具体场景自定义 Open WebUI。欢迎贡献更多内容，可查看 contributing 教程。

什么是 `Kokoro-FastAPI`？

Kokoro-FastAPI 是 Kokoro-82M 文本转语音模型的 Docker 化 FastAPI 封装，实现了 OpenAI API 端点规范，并提供高性能的文本转语音能力。

主要特性

兼容 OpenAI Speech 端点，支持内联语音组合
支持 NVIDIA GPU 加速或 CPU ONNX 推理
支持流式输出与可变分块
支持多种音频格式（.mp3、.wav、.opus、.flac、.aac、.pcm）
集成 Web 界面，默认位于 localhost:8880/web（仓库中也提供了额外 gradio 容器）
提供音素转换与生成功能端点

语音

af
af_bella
af_irulan
af_nicole
af_sarah
af_sky
am_adam
am_michael
am_gurney
bf_emma
bf_isabella
bm_george
bm_lewis

语言

en_us
en_uk

前置要求

系统已安装 Docker
Open WebUI 正在运行
若使用 GPU：需要支持 CUDA 12.3 的 NVIDIA GPU
若仅 CPU：无特殊要求

⚡️ 快速开始

你可以选择 GPU 或 CPU 版本

GPU 版本（需要支持 CUDA 12.8 的 NVIDIA GPU）

使用 docker run：

docker run --gpus all -p 8880:8880 ghcr.io/remsky/kokoro-fastapi-gpu

或者创建 docker-compose.yml 后用 docker compose 启动。例如：

name: kokoro
services:
    kokoro-fastapi-gpu:
        ports:
            - 8880:8880
        image: ghcr.io/remsky/kokoro-fastapi-gpu:v0.2.1
        restart: always
        deploy:
            resources:
                reservations:
                    devices:
                        - driver: nvidia
                          count: all
                          capabilities:
                              - gpu

信息

你可能需要先安装并配置 NVIDIA Container Toolkit

CPU 版本（ONNX 优化推理）

使用 docker run：

docker run -p 8880:8880 ghcr.io/remsky/kokoro-fastapi-cpu

使用 docker compose：

name: kokoro
services:
    kokoro-fastapi-cpu:
        ports:
            - 8880:8880
        image: ghcr.io/remsky/kokoro-fastapi-cpu
        restart: always

配置 Open WebUI 使用 `Kokoro-FastAPI`

按照以下步骤让 Open WebUI 使用 Kokoro-FastAPI：

打开管理面板并进入 设置 -> 音频
将 TTS 设置为：
- 文本转语音引擎：OpenAI
  - API 基础 URL：http://localhost:8880/v1 # 也可能需要改成 host.docker.internal
  - API 密钥：not-needed
  - TTS 语音：af_bella # 也接受现有 OAI voice 的映射值以保持兼容
  - TTS 模型：kokoro

信息

默认 API 密钥字符串是 not-needed。如果你不需要额外安全控制，可以保持不变。

构建 Docker 容器

git clone https://github.com/remsky/Kokoro-FastAPI.git
cd Kokoro-FastAPI
cd docker/cpu # 或 docker/gpu
docker compose up --build

就是这么简单！

如需了解构建容器、修改端口等更多信息，请参阅 Kokoro-FastAPI 仓库。

故障排查

未检测到 NVIDIA GPU

如果 GPU 版本没有使用到你的显卡：

安装 NVIDIA Container Toolkit：

# Ubuntu/Debian
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker

验证 GPU 可访问：

docker run --rm --gpus all nvidia/cuda:12.2.0-base nvidia-smi

从 Open WebUI 连接失败

如果 Open WebUI 无法访问 Kokoro，这通常是一个 Docker 网络问题。请根据你的部署情况选择对应方式：

方案 1 — Docker Desktop（Windows/Mac）：

使用 host.docker.internal 代替 localhost：http://host.docker.internal:8880/v1

方案 2 — Docker Compose（同一网络）：

直接使用服务名：http://kokoro-fastapi-gpu:8880/v1

方案 3 — Docker 网络（Linux 推荐）：

如果 host.docker.internal 不可用，可创建一个共享的 Docker 网络：

# 创建 Docker 网络
docker network create local-llm

# 将两个容器接入该网络
docker network connect local-llm open-webui
docker network connect local-llm kokoro-fastapi

# 重启两个容器
docker restart open-webui kokoro-fastapi

随后将 API Base URL 设置为 http://kokoro-fastapi:8880/v1

确认服务正在运行：curl http://localhost:8880/health

本内容仅供参考，不构成任何保证、担保或合同承诺。Open WebUI 按“现状”提供。请参阅您的许可协议以了解适用条款。

什么是 Kokoro-FastAPI？​

主要特性​

语音​

语言​

前置要求​

⚡️ 快速开始​

你可以选择 GPU 或 CPU 版本​

GPU 版本（需要支持 CUDA 12.8 的 NVIDIA GPU）​

CPU 版本（ONNX 优化推理）​

配置 Open WebUI 使用 Kokoro-FastAPI​

构建 Docker 容器​

故障排查​

未检测到 NVIDIA GPU​

从 Open WebUI 连接失败​