多模型聊天

Open WebUI 允许你在单个聊天界面中同时与多个模型交互。这一强大功能让你可以并排比较回答、交叉验证事实，并结合不同 LLM 的独特优势。

概览

在多模型聊天中，你的提示词会同时发送给两个或更多已选模型。它们的回复会以并列列布局显示（或在小屏幕上堆叠显示），让你能够立刻看到不同 AI 架构面对同一问题时的处理方式。

选择模型：在聊天头部的模型选择器中，点击 +（Plus） 按钮，将更多模型添加到当前会话
- 示例组合：选择 GPT-5.1 Thinking（负责推理）、Gemini 3（擅长创意写作）和 Claude Sonnet 4.5（综合表现强）
发送提示词：像平常一样输入你的问题
查看结果：观察所有模型在聊天窗口中同时生成回复

管理员可按角色或用户组控制对多模型聊天的访问权限。

位置：Admin Panel > Settings > General > User Permissions > Chat > Multiple Models
环境变量：USER_PERMISSIONS_CHAT_MULTIPLE_MODELS（默认：True）

如果关闭，用户将看不到模型选择器中的 “plus” 按钮，也无法发起多模型会话。

当你获得多个模型的回复后，Open WebUI 还提供一个更高级的能力：将它们合并为一个更优答案。这实现了 Mixture of Agents（MOA） 工作流。

合并会把所有当前激活模型的输出，加上你的原始提示词，一并发送给一个“合成模型（Synthesizer Model）”。这个合成模型会阅读所有草稿答案，并将它们融合为一个最终的、经过打磨的回复。

合并过程依赖后端的 Tasks 系统。

任务模型：用于执行合并的具体模型，可在 Admin Panel > Settings > Tasks 中配置。我们建议使用能力较强的模型（如 GPT-5.1 或 Claude Sonnet 4.5）作为任务模型，以获得最佳结果
提示模板：系统会使用一个专门的提示模板，引导 AI 如何综合这些答案

实验性功能

合并 / MOA 是一个高级能力。它功能很强，但需要一个足够强大的任务模型才能发挥效果。

本内容仅供参考，不构成任何保证、担保或合同承诺。Open WebUI 按“现状”提供。请参阅您的许可协议以了解适用条款。