环境变量

环境变量清单

信息

如需查看 Open WebUI 的全部环境变量，请参阅 Environment Variable Configuration 页面。

下文汇总了语音转文本（STT）和文本转语音（TTS）相关的环境变量。

UI 配置

其中大多数设置也可以在 管理面板 → 设置 → 音频 中配置。环境变量会在启动时优先生效，但之后仍可在 UI 中覆盖。

语音转文本（STT）环境变量

预处理

变量	说明	默认值
`BYPASS_PYDUB_PREPROCESSING`	在将音频发送到 STT 引擎前，跳过基于 pydub 的预处理（MP3 转换、压缩、分块切分）。适用于所有引擎。当上游提供商已处理这些步骤，或主机上没有 ffmpeg 时很有用。	`false`

本地 Whisper

变量	说明	默认值
`WHISPER_MODEL`	Whisper 模型大小	`base`
`WHISPER_MODEL_DIR`	Whisper 模型文件的存储目录	`{CACHE_DIR}/whisper/models`
`WHISPER_COMPUTE_TYPE`	推理使用的计算类型（见下方说明）	`int8`
`WHISPER_LANGUAGE`	ISO 639-1 语言代码（留空 = 自动检测）	empty
`WHISPER_MULTILINGUAL`	使用多语言 Whisper 模型	`false`
`WHISPER_MODEL_AUTO_UPDATE`	自动下载模型更新	`false`
`WHISPER_VAD_FILTER`	启用语音活动检测过滤器	`false`

WHISPER_COMPUTE_TYPE 可选值

int8 —— CPU 默认值，速度最快，但在较老的 GPU 上可能不可用
float16 —— CUDA / GPU 推荐值
int8_float16 —— 混合模式（int8 权重，float16 计算）
float32 —— 兼容性最高，但最慢

如果你使用 :cuda Docker 镜像且 GPU 较旧，请设置 WHISPER_COMPUTE_TYPE=float16 以避免报错。

OpenAI 兼容 STT

变量	说明	默认值
`AUDIO_STT_ENGINE`	STT 引擎：留空（本地 Whisper）、`openai`、`azure`、`deepgram`、`mistral`	empty
`AUDIO_STT_MODEL`	外部提供商使用的 STT 模型	empty
`AUDIO_STT_OPENAI_API_BASE_URL`	OpenAI 兼容 API 基础 URL	`https://api.openai.com/v1`
`AUDIO_STT_OPENAI_API_KEY`	OpenAI API 密钥	empty
`AUDIO_STT_SUPPORTED_CONTENT_TYPES`	支持的音频 MIME 类型，逗号分隔	empty

Azure STT

变量	说明	默认值
`AUDIO_STT_AZURE_API_KEY`	Azure Cognitive Services API 密钥	empty
`AUDIO_STT_AZURE_REGION`	Azure 区域	`eastus`
`AUDIO_STT_AZURE_LOCALES`	地区列表，逗号分隔（例如 `en-US,de-DE`）	auto
`AUDIO_STT_AZURE_BASE_URL`	自定义 Azure 基础 URL（可选）	empty
`AUDIO_STT_AZURE_MAX_SPEAKERS`	说话人数上限（用于说话人分离）	`3`

Deepgram STT

变量	说明	默认值
`DEEPGRAM_API_KEY`	Deepgram API 密钥	empty

Mistral STT

变量	说明	默认值
`AUDIO_STT_MISTRAL_API_KEY`	Mistral API 密钥	empty
`AUDIO_STT_MISTRAL_API_BASE_URL`	Mistral API 基础 URL	`https://api.mistral.ai/v1`
`AUDIO_STT_MISTRAL_USE_CHAT_COMPLETIONS`	使用 chat completions 端点	`false`

文本转语音（TTS）环境变量

通用 TTS

变量	说明	默认值
`AUDIO_TTS_ENGINE`	TTS 引擎：留空（禁用）、`openai`、`mistral`、`elevenlabs`、`azure`、`transformers`	empty
`AUDIO_TTS_MODEL`	TTS 模型	`tts-1`
`AUDIO_TTS_VOICE`	默认语音	`alloy`
`AUDIO_TTS_SPLIT_ON`	文本切分方式：`punctuation`、`paragraphs` 或 `none`	`punctuation`
`AUDIO_TTS_API_KEY`	ElevenLabs 或 Azure TTS 使用的 API 密钥	empty

OpenAI 兼容 TTS

变量	说明	默认值
`AUDIO_TTS_OPENAI_API_BASE_URL`	OpenAI 兼容 TTS API 基础 URL	`https://api.openai.com/v1`
`AUDIO_TTS_OPENAI_API_KEY`	OpenAI TTS API 密钥	empty
`AUDIO_TTS_OPENAI_PARAMS`	OpenAI TTS 附加 JSON 参数	empty

Mistral TTS

变量	说明	默认值
`AUDIO_TTS_MISTRAL_API_KEY`	Mistral TTS API 密钥	empty
`AUDIO_TTS_MISTRAL_API_BASE_URL`	Mistral API 基础 URL	`https://api.mistral.ai/v1`

信息

当 AUDIO_TTS_ENGINE=mistral 且 AUDIO_TTS_MODEL 为空时，Open WebUI 会默认使用 mistral-tts-latest。

Azure TTS

变量	说明	默认值
`AUDIO_TTS_AZURE_SPEECH_REGION`	Azure Speech 区域	`eastus`
`AUDIO_TTS_AZURE_SPEECH_BASE_URL`	自定义 Azure Speech 基础 URL（可选）	empty
`AUDIO_TTS_AZURE_SPEECH_OUTPUT_FORMAT`	音频输出格式	`audio-24khz-160kbitrate-mono-mp3`

音频配置提示

使用本地 Whisper STT

如果你遇到 GPU 加速问题或使用较旧 GPU，可以尝试设置：

environment:
  - WHISPER_COMPUTE_TYPE=float16

使用外部 TTS 服务

如果你在 Docker 中运行 Open WebUI 并接入外部 TTS 服务：

environment:
  - AUDIO_TTS_ENGINE=openai
  - AUDIO_TTS_OPENAI_API_BASE_URL=http://host.docker.internal:5050/v1
  - AUDIO_TTS_OPENAI_API_KEY=your-api-key

提示

在 Docker Desktop（Windows / Mac）中可使用 host.docker.internal 访问宿主机服务；Linux 上请使用宿主机 IP 或容器网络。

如需排查音频问题，请参阅音频故障排查指南。

本内容仅供参考，不构成任何保证、担保或合同承诺。Open WebUI 按“现状”提供。请参阅您的许可协议以了解适用条款。

环境变量清单​

语音转文本（STT）环境变量​

预处理​

本地 Whisper​

OpenAI 兼容 STT​

Azure STT​

Deepgram STT​

Mistral STT​

文本转语音（TTS）环境变量​

通用 TTS​

OpenAI 兼容 TTS​

Mistral TTS​

Azure TTS​

音频配置提示​

使用本地 Whisper STT​

使用外部 TTS 服务​