跳到主要内容

多模型聊天

Open WebUI 允许你在单个聊天界面中同时与多个模型交互。这一强大功能让你可以并排比较回答、交叉验证事实,并结合不同 LLM 的独特优势。

概览

在多模型聊天中,你的提示词会同时发送给两个或更多已选模型。它们的回复会以并列列布局显示(或在小屏幕上堆叠显示),让你能够立刻看到不同 AI 架构面对同一问题时的处理方式。

如何使用

  1. 选择模型:在聊天头部的模型选择器中,点击 +(Plus) 按钮,将更多模型添加到当前会话
    • 示例组合:选择 GPT-5.1 Thinking(负责推理)、Gemini 3(擅长创意写作)和 Claude Sonnet 4.5(综合表现强)
  2. 发送提示词:像平常一样输入你的问题
  3. 查看结果:观察所有模型在聊天窗口中同时生成回复

使用场景

  • 模型比较 / 基准测试:测试哪个模型更擅长写 Python 代码,或哪个模型在小众主题上幻觉更少
  • 事实校验:对多个模型进行“交叉盘问”。如果两个模型说 X,而另一个说 Y,你就可以进一步调查
  • 多元视角:针对同一个问题,从一个模型获得“创意型”回答,从另一个模型获得“技术型”回答

权限

管理员可按角色或用户组控制对多模型聊天的访问权限。

  • 位置:Admin Panel > Settings > General > User Permissions > Chat > Multiple Models
  • 环境变量USER_PERMISSIONS_CHAT_MULTIPLE_MODELS(默认:True

如果关闭,用户将看不到模型选择器中的 “plus” 按钮,也无法发起多模型会话。


合并回复(Mixture of Agents)

当你获得多个模型的回复后,Open WebUI 还提供一个更高级的能力:将它们合并为一个更优答案。这实现了 Mixture of Agents(MOA) 工作流。

什么是合并?

合并会把所有当前激活模型的输出,加上你的原始提示词,一并发送给一个“合成模型(Synthesizer Model)”。这个合成模型会阅读所有草稿答案,并将它们融合为一个最终的、经过打磨的回复。

如何合并

  1. 启动一个多模型聊天,并获取多个模型的回复
  2. 在回复控制区域找到 合并(或 “Synthesize”)按钮(通常位于重新生成控制附近)
  3. Open WebUI 会生成一个新的回复,综合之前各个模型输出中的最佳部分

合并的优势

  • 更高准确性:研究表明,聚合多个模型的输出,往往优于任何一个单独模型的结果
  • 兼得优势:例如,你可以同时获得模型 A 的代码准确性和模型 B 的解释清晰度
  • 减少幻觉:综合模型可以过滤掉单个回复中的不一致内容

配置

合并过程依赖后端的 Tasks 系统。

  • 任务模型:用于执行合并的具体模型,可在 Admin Panel > Settings > Tasks 中配置。我们建议使用能力较强的模型(如 GPT-5.1 或 Claude Sonnet 4.5)作为任务模型,以获得最佳结果
  • 提示模板:系统会使用一个专门的提示模板,引导 AI 如何综合这些答案
实验性功能

合并 / MOA 是一个高级能力。它功能很强,但需要一个足够强大的任务模型才能发挥效果。

本内容仅供参考,不构成任何保证、担保或合同承诺。Open WebUI 按“现状”提供。请参阅您的许可协议 以了解适用条款。