多模型聊天
Open WebUI 允许你在单个聊天界面中同时与多个模型交互。这一强大功能让你可以并排比较回答、交叉验证事实,并结合不同 LLM 的独特优势。
概览
在多模型聊天中,你的提示词会同时发送给两个或更多已选模型。它们的回复会以并列列布局显示(或在小屏幕上堆叠显示),让你能够立刻看到不同 AI 架构面对同一问题时的处理方式。
如何使用
- 选择模型:在聊天头部的模型选择器中,点击 +(Plus) 按钮,将更多模型添加到当前会话
- 示例组合:选择 GPT-5.1 Thinking(负责推理)、Gemini 3(擅长创意写作)和 Claude Sonnet 4.5(综合表现强)
- 发送提示词:像平常一样输入你的问题
- 查看结果:观察所有模型在聊天窗口中同时生成回复
使用场景
- 模型比较 / 基准测试:测试哪个模型更擅长写 Python 代码,或哪个模型在小众主题上幻觉更少
- 事实校验:对多个模型进行“交叉盘问”。如果两个模型说 X,而另一个说 Y,你就可以进一步调查
- 多元视角:针对同一个问题,从一个模型获得“创意型”回答,从另一个模型获得“技术型”回答
权限
管理员可按角色或用户组控制对多模型聊天的访问权限。
- 位置:Admin Panel > Settings > General > User Permissions > Chat > Multiple Models
- 环境变量:
USER_PERMISSIONS_CHAT_MULTIPLE_MODELS(默认:True)
如果关闭,用户将看不到模型选择器中的 “plus” 按钮,也无法发起多模型会话。
合并回复(Mixture of Agents)
当你获得多个模型的回复后,Open WebUI 还提供一个更高级的能力:将它们合并为一个更优答案。这实现了 Mixture of Agents(MOA) 工作流。
什么是合并?
合并会把所有当前激活模型的输出,加上你的原始提示词,一并发送给一个“合成模型(Synthesizer Model)”。这个合成模型会阅读所有草稿答案,并将它们融合为一个最终的、经过打磨的回复。
如何合并
- 启动一个多模型聊天,并获取多个模型的回复
- 在回复控制区域找到 合并(或 “Synthesize”)按钮(通常位于重新生成控制附近)
- Open WebUI 会生成一个新的回复,综合之前各个模型输出中的最佳部分
合并的优势
- 更高准确性:研究表明,聚合多个模型的输出,往往优于任何一个单独模型的结果
- 兼得优势:例如,你可以同时获得模型 A 的代码准确性和模型 B 的解释清晰度
- 减少幻觉:综合模型可以过滤掉单个回复中的不一致内容
配置
合并过程依赖后端的 Tasks 系统。
- 任务模型:用于执行合并的具体模型,可在 Admin Panel > Settings > Tasks 中配置。我们建议使用能力较强的模型(如 GPT-5.1 或 Claude Sonnet 4.5)作为任务模型,以获得最佳结果
- 提示模板:系统会使用一个专门的提示模板,引导 AI 如何综合这些答案
实验性功能
合并 / MOA 是一个高级能力。它功能很强,但需要一个足够强大的任务模型才能发挥效果。