跳到主要内容

使用 Mistral Voxtral 实现语音转文本

本指南介绍如何在 Open WebUI 中使用 Mistral 的 Voxtral 模型进行语音转文本。Voxtral 是 Mistral 的语音转文本模型,可提供较准确的转录结果。

想配置 TTS?

请查看配套指南:使用 Mistral 实现文本转语音

前置要求

  • 一个 Mistral API 密钥
  • Open WebUI 已安装并正常运行

快速配置(UI)

  1. 点击你的头像图标(左下角)
  2. 选择 管理面板
  3. 点击 设置音频 标签
  4. 按如下方式配置:
设置
语音转文本引擎MistralAI
API 密钥你的 Mistral API 密钥
STT 模型voxtral-mini-latest(或留空使用默认值)
  1. 点击 Save

可用模型

模型说明
voxtral-mini-latest默认转录模型(推荐)

环境变量配置

如果你更倾向于使用环境变量:

services:
  open-webui:
    image: ghcr.io/open-webui/open-webui:main
    environment:
      - AUDIO_STT_ENGINE=mistral
      - AUDIO_STT_MISTRAL_API_KEY=your-mistral-api-key
      - AUDIO_STT_MODEL=voxtral-mini-latest
    # ... 其他配置

全部 Mistral STT 环境变量

变量说明默认值
AUDIO_STT_ENGINE设置为 mistralempty(使用本地 Whisper)
AUDIO_STT_MISTRAL_API_KEY你的 Mistral API 密钥empty
AUDIO_STT_MISTRAL_API_BASE_URLMistral API 基础 URLhttps://api.mistral.ai/v1
AUDIO_STT_MISTRAL_USE_CHAT_COMPLETIONS使用 chat completions 端点false
AUDIO_STT_MODELSTT 模型voxtral-mini-latest

转录方式

Mistral 支持两种转录方式:

标准转录(默认)

使用专用转录端点。这是推荐方式。

Chat Completions 方式

AUDIO_STT_MISTRAL_USE_CHAT_COMPLETIONS=true 后,可改用 Mistral 的 chat completions API 进行转录。该方式:

  • 要求音频为 mp3 或 wav 格式(系统会尝试自动转换)
  • 结果可能与标准端点有所不同

使用 STT

  1. 点击聊天输入框中的麦克风图标
  2. 说出你的内容
  3. 再次点击麦克风,或等待静音检测结束
  4. 你的语音会被转录并显示在输入框中

支持的音频格式

Voxtral 接受常见音频格式。系统默认允许 audio/*video/webm

如果使用 chat completions 方式,音频会自动转换为 mp3。

故障排查

API 密钥错误

如果你看到 “需要 Mistral API 密钥”:

  1. 确认 API 密钥填写正确
  2. 检查 API 密钥是否已过期
  3. 确认你的 Mistral 账号已开通 API 访问权限

转录无法工作

  1. 检查容器日志:docker logs open-webui -f
  2. 确认 STT 引擎设置为 MistralAI
  3. 优先尝试标准转录方式(关闭 chat completions)

音频格式问题

如果你使用 chat completions 方式且音频转换失败:

  • 确保容器中可用 FFmpeg
  • 尝试录制为其他格式(wav 或 mp3)
  • 切回标准转录方式

更多排查信息请参阅 音频故障排查指南

与其他 STT 方案对比

特性Mistral VoxtralOpenAI Whisper本地 Whisper
成本按分钟计费按分钟计费免费
隐私音频发送到 Mistral音频发送到 OpenAI音频保留本地
模型选项voxtral-mini-latestwhisper-1tiny → large
需要 GPU推荐

成本说明

Mistral 的 STT 按音频分钟数计费。当前价格请查看 Mistral 定价页

提示

如果想使用免费 STT,可选择 Local Whisper(默认方案)或浏览器 Web API 进行基础转录。

本内容仅供参考,不构成任何保证、担保或合同承诺。Open WebUI 按“现状”提供。请参阅您的许可协议 以了解适用条款。