vLLM

概览

vLLM 提供兼容 OpenAI 的 API（聊天补全），因此可以很容易接入 Open WebUI。本指南将展示如何连接你的 vLLM 服务器。

提示

对于实现该规范的提供商，Open WebUI 也支持实验性的 Open Responses 规范。

请确保 vLLM 服务器已经启动并可访问。默认 API 基础 URL 通常为：

http://localhost:8000/v1

如果是远程服务器，请改用对应的主机名或 IP 地址。

进入 ⚙️ Admin Settings。
打开 Connections > OpenAI > Manage（查找扳手图标）。
点击 ➕ Add New Connection。
选择 Standard / Compatible 标签（如果可见）。
填写以下内容：
- API URL：http://localhost:8000/v1（或你的 vLLM 服务器 URL）
  - Docker 用户： 如果 Open WebUI 运行在容器中，请使用 http://host.docker.internal:8000/v1。
- API Key：none（如果未配置密钥，也可以留空）
点击 Save。

从模型选择器中选择 vLLM 服务器提供的任意模型，然后开始聊天。

连接超时配置

如果你的 vLLM 服务器响应较慢（尤其在模型加载时），可以调整超时：

# 针对较慢的模型初始化提高超时（默认 10 秒）
AIOHTTP_CLIENT_TIMEOUT_MODEL_LIST=30

如果你保存了一个不可达 URL，导致界面卡住，请查看模型列表加载问题故障排查页面。

本内容仅供参考，不构成任何保证、担保或合同承诺。Open WebUI 按“现状”提供。请参阅您的许可协议以了解适用条款。