跳到主要内容

环境变量

环境变量清单

信息

如需查看 Open WebUI 的全部环境变量,请参阅 Environment Variable Configuration 页面。

下文汇总了语音转文本(STT)和文本转语音(TTS)相关的环境变量。

UI 配置

其中大多数设置也可以在 管理面板 → 设置 → 音频 中配置。环境变量会在启动时优先生效,但之后仍可在 UI 中覆盖。

语音转文本(STT)环境变量

预处理

变量说明默认值
BYPASS_PYDUB_PREPROCESSING在将音频发送到 STT 引擎前,跳过基于 pydub 的预处理(MP3 转换、压缩、分块切分)。适用于所有引擎。当上游提供商已处理这些步骤,或主机上没有 ffmpeg 时很有用。false

本地 Whisper

变量说明默认值
WHISPER_MODELWhisper 模型大小base
WHISPER_MODEL_DIRWhisper 模型文件的存储目录{CACHE_DIR}/whisper/models
WHISPER_COMPUTE_TYPE推理使用的计算类型(见下方说明)int8
WHISPER_LANGUAGEISO 639-1 语言代码(留空 = 自动检测)empty
WHISPER_MULTILINGUAL使用多语言 Whisper 模型false
WHISPER_MODEL_AUTO_UPDATE自动下载模型更新false
WHISPER_VAD_FILTER启用语音活动检测过滤器false
WHISPER_COMPUTE_TYPE 可选值
  • int8 —— CPU 默认值,速度最快,但在较老的 GPU 上可能不可用
  • float16 —— CUDA / GPU 推荐值
  • int8_float16 —— 混合模式(int8 权重,float16 计算)
  • float32 —— 兼容性最高,但最慢

如果你使用 :cuda Docker 镜像且 GPU 较旧,请设置 WHISPER_COMPUTE_TYPE=float16 以避免报错。

OpenAI 兼容 STT

变量说明默认值
AUDIO_STT_ENGINESTT 引擎:留空(本地 Whisper)、openaiazuredeepgrammistralempty
AUDIO_STT_MODEL外部提供商使用的 STT 模型empty
AUDIO_STT_OPENAI_API_BASE_URLOpenAI 兼容 API 基础 URLhttps://api.openai.com/v1
AUDIO_STT_OPENAI_API_KEYOpenAI API 密钥empty
AUDIO_STT_SUPPORTED_CONTENT_TYPES支持的音频 MIME 类型,逗号分隔empty

Azure STT

变量说明默认值
AUDIO_STT_AZURE_API_KEYAzure Cognitive Services API 密钥empty
AUDIO_STT_AZURE_REGIONAzure 区域eastus
AUDIO_STT_AZURE_LOCALES地区列表,逗号分隔(例如 en-US,de-DEauto
AUDIO_STT_AZURE_BASE_URL自定义 Azure 基础 URL(可选)empty
AUDIO_STT_AZURE_MAX_SPEAKERS说话人数上限(用于说话人分离)3

Deepgram STT

变量说明默认值
DEEPGRAM_API_KEYDeepgram API 密钥empty

Mistral STT

变量说明默认值
AUDIO_STT_MISTRAL_API_KEYMistral API 密钥empty
AUDIO_STT_MISTRAL_API_BASE_URLMistral API 基础 URLhttps://api.mistral.ai/v1
AUDIO_STT_MISTRAL_USE_CHAT_COMPLETIONS使用 chat completions 端点false

文本转语音(TTS)环境变量

通用 TTS

变量说明默认值
AUDIO_TTS_ENGINETTS 引擎:留空(禁用)、openaimistralelevenlabsazuretransformersempty
AUDIO_TTS_MODELTTS 模型tts-1
AUDIO_TTS_VOICE默认语音alloy
AUDIO_TTS_SPLIT_ON文本切分方式:punctuationparagraphsnonepunctuation
AUDIO_TTS_API_KEYElevenLabs 或 Azure TTS 使用的 API 密钥empty

OpenAI 兼容 TTS

变量说明默认值
AUDIO_TTS_OPENAI_API_BASE_URLOpenAI 兼容 TTS API 基础 URLhttps://api.openai.com/v1
AUDIO_TTS_OPENAI_API_KEYOpenAI TTS API 密钥empty
AUDIO_TTS_OPENAI_PARAMSOpenAI TTS 附加 JSON 参数empty

Mistral TTS

变量说明默认值
AUDIO_TTS_MISTRAL_API_KEYMistral TTS API 密钥empty
AUDIO_TTS_MISTRAL_API_BASE_URLMistral API 基础 URLhttps://api.mistral.ai/v1
信息

AUDIO_TTS_ENGINE=mistralAUDIO_TTS_MODEL 为空时,Open WebUI 会默认使用 mistral-tts-latest

Azure TTS

变量说明默认值
AUDIO_TTS_AZURE_SPEECH_REGIONAzure Speech 区域eastus
AUDIO_TTS_AZURE_SPEECH_BASE_URL自定义 Azure Speech 基础 URL(可选)empty
AUDIO_TTS_AZURE_SPEECH_OUTPUT_FORMAT音频输出格式audio-24khz-160kbitrate-mono-mp3

音频配置提示

使用本地 Whisper STT

如果你遇到 GPU 加速问题或使用较旧 GPU,可以尝试设置:

environment:
  - WHISPER_COMPUTE_TYPE=float16

使用外部 TTS 服务

如果你在 Docker 中运行 Open WebUI 并接入外部 TTS 服务:

environment:
  - AUDIO_TTS_ENGINE=openai
  - AUDIO_TTS_OPENAI_API_BASE_URL=http://host.docker.internal:5050/v1
  - AUDIO_TTS_OPENAI_API_KEY=your-api-key
提示

在 Docker Desktop(Windows / Mac)中可使用 host.docker.internal 访问宿主机服务;Linux 上请使用宿主机 IP 或容器网络。

如需排查音频问题,请参阅 音频故障排查指南

本内容仅供参考,不构成任何保证、担保或合同承诺。Open WebUI 按“现状”提供。请参阅您的许可协议 以了解适用条款。