跳到主要内容

🤖 模型

用自定义指令、工具和知识库包装任何模型,构建专属智能体。

模型工作区让您创建叠加在任何基础模型之上的配置预设。选择 GPT-4o、Claude、Llama 3 或 Open WebUI 连接的任何其他模型,然后将系统提示词、知识库、工具、技能和参数覆盖绑定到它。结果是一个行为完全符合需求的专用智能体,无需修改底层模型。

一个始终使用您的风格指南的"Python 导师"。一个使用公司模板的"会议摘要助手"。一个内置了代码规范规则的"代码审查员"。每个智能体都是一个轻薄包装器:选择一个基础模型,配置它,然后与团队共享。


为什么使用模型?

一个基础模型,多种角色

同一个 GPT-4o 可以驱动编程助手、客户支持机器人和创意写作工具。每个预设都有自己的系统提示词、工具和知识库,因此根据所选预设,模型的行为会有所不同。

知识库和工具预先附加

不再需要每次对话都手动附加文档和启用工具,只需将它们一次性绑定到模型预设。用户开箱即可获得完全配置的智能体。

细粒度访问控制

将模型限制为特定用户或用户组。财务团队看到他们的模型;工程团队看到他们的模型。管理员控制实例范围内的可用内容。

动态系统提示词

使用 Jinja2 风格的变量,如 {{ USER_NAME }}{{ CURRENT_DATE }},使系统提示词自动适应每个用户和会话。


主要功能

🧩 模型预设系统提示词、工具、知识库、技能和参数集于一体
🏷️ 动态变量{{ USER_NAME }}{{ CURRENT_DATE }}{{ CURRENT_TIME }} 自动注入
🔧 绑定工具按模型强制启用特定工具
📚 附加知识库通过 RAG 或全文上下文始终可用的知识库和文件
🎭 技能绑定 Markdown 指令集,通过 view_skill 按需加载
👥 访问控制限制为特定用户或用户组
📊 全局默认值一次性为所有模型设置基础能力和参数
🔊 每模型 TTS 声音为每个角色设置专属语音

创建模型

工作区 > 模型中点击 + 新建模型,或点击现有模型上的省略号(...)并选择编辑

核心配置

字段说明
头像上传自定义图片。支持动态 GIF 和 WebP
名称和 ID显示名称和唯一标识符
基础模型驱动此智能体的实际模型
描述模型选择器中显示的简短摘要
标签在下拉菜单中组织模型
可见性私有(特定用户/用户组)或公开

系统提示词和变量

系统提示词定义了行为和角色。使用动态变量实现上下文感知的指令:

变量输出示例
{{ CURRENT_DATE }}2024-10-27
{{ CURRENT_TIME }}14:30:05
{{ USER_NAME }}Admin
{{ USER_GROUPS }}Engineering, Beta Testers(逗号分隔;若用户不在任何用户组中则为空)
您是 {{ USER_NAME }} 的助手。
当前日期是 {{ CURRENT_DATE }}。
群组感知的系统提示词

{{ USER_GROUPS }} 让一个共享模型能够根据调用者的 RBAC 用户组自适应其行为——例如:"仅当 {{ USER_GROUPS }} 包含 'Engineering' 时,你才可以讨论内部路线图项目。" 该占位符在聊天时由服务端解析,并且数据库查询仅在模板中实际引用该变量时才会执行。

能力和绑定

切换模型可以执行的操作并绑定资源:

设置控制内容
知识库绑定集合或文件。点击已附加项在专注检索和全文上下文之间切换。参见检索模式
工具强制启用特定工具(例如为数学机器人启用计算器)
技能绑定技能,使其清单始终被注入
过滤器附加流水线过滤器(例如 PII 脱敏)
操作附加操作脚本(例如"添加到记忆")
视觉启用图像分析(需要支持视觉的基础模型)
网络搜索启用已配置的搜索提供商
代码解释器启用 Python 代码执行
图像生成启用图像生成
内置工具控制可用的工具类别:时间、记忆、对话、笔记、知识库、频道、任务管理、自动化
文件上下文启用时,附加文件通过 RAG 处理。禁用时,不提取文件内容
TTS 声音为此模型的响应设置特定语音

高级参数

  • 停止序列:在特定字符串处强制停止生成(例如 <|end_of_text|>User:)。每个后按 Enter。
  • 温度、Top P 等:调整创造力和确定性。

提示词建议

用户使用此模型打开新对话时显示的可点击起始标签。添加诸如"逐步解释这段代码"或"总结这份文档"等短语,引导用户。


模型管理

从模型列表中,点击任意模型上的省略号(...):

操作说明
编辑打开配置面板
隐藏从模型选择器中移除,不删除
克隆创建副本(附加 -clone
复制链接复制模型设置的直接 URL
导出将配置下载为 .json
分享分享到 Open WebUI 社区
删除永久删除预设

导入和导出

  • 导入:从 .json 文件或 Open WebUI 社区链接导入
  • 导出:将所有自定义模型配置下载为单个 .json
  • 发现:在页面底部浏览社区预设
下载基础模型

要下载新的基础模型,请进入设置 > 连接 > Ollama 或在模型选择器中输入 ollama run hf.co/{username}/{repository}:{quantization}


全局模型默认值(管理员)

管理员可以通过**管理面板 > 设置 > 模型 > ⚙️(齿轮图标)**设置适用于所有模型的基础能力和参数。

  • 默认模型元数据DEFAULT_MODEL_METADATA):基础能力(视觉、网络搜索、文件上下文、代码解释器、内置工具)。冲突时,按模型的覆盖始终优先。
  • 默认模型参数DEFAULT_MODEL_PARAMS):基础推理参数(温度、top_p、max_tokens、function_calling)。明确设置时,按模型值优先。此值作为 JSON 从环境变量加载;无效 JSON 会被忽略,回退到 {}

合并行为

设置类型策略示例
能力深度合并全局设置 file_context: false,模型设置 vision: true → 模型同时获得两者
其他元数据仅填充全局设置描述,模型无描述 → 模型获得全局值
参数简单合并全局设置 temperature: 0.7,模型设置 0.3 → 模型获得 0.3
知识库 + 函数调用交互

在全局参数中设置 function_calling: native 会改变所有模型处理附加知识库的方式。在原生模式下,绑定到模型的知识库不会自动注入。模型必须调用内置工具来检索知识。如果您的知识库突然停止工作,请先检查全局默认值。

参见知识库故障排查

批量管理

按状态(启用、禁用、可见、隐藏)过滤管理员模型列表,并使用批量操作一次性启用或禁用当前视图中的所有模型。当外部提供商暴露数百个模型时非常有用。


对话中切换模型

在不丢失上下文的情况下切换模型。同时选择最多两个模型,并排比较响应,使用箭头按钮在它们之间导航。


使用场景

团队专属智能体

创建一个带有 CRM 知识库、异议处理提示词和邮件起草工具的"销售助手"。与销售用户组共享。工程团队永远看不到它。

新用户引导

构建带有描述性提示词建议的模型("问我公司政策"、"帮我设置开发环境"),让新团队成员清楚地知道该问什么。

强制执行组织标准

设置全局默认值以禁用所有模型的代码解释器、强制执行一致的温度,或要求函数调用。需要时,各模型可以覆盖。


策展式界面部署

一种常见的部署模式是向普通用户呈现一个策展好的模型——一个带有特定名称、图标、系统提示词和工具的预配置智能体——而底层的基础模型仅对高级用户或管理员可见,他们需要直接访问。

推荐模式:两个基础模型条目

实现差异可见性的正确方式是创建两个独立的基础模型条目,它们指向同一个底层 LLM:

条目访问权限隐藏可见对象用途
基础模型(例如 "GPT-4o")限制为高级用户仅高级用户直接探索和测试
策展模型(例如 "Company Assistant")公开所有人普通用户使用的产品

策展模型是一等公民的基础模型条目——而不是在受限基础模型之上包装的工作区模型。为它配置自己的名称、头像、系统提示词、知识库、工具和参数覆盖。它连接到同一个上游 LLM,但是一个独立的配置条目。

分步设置:

  1. 管理面板 > 模型中,找到你的基础模型(例如 "GPT-4o")。
  2. 将其访问控制设置为私有,并仅授予你的高级用户/管理员用户组访问权限。
  3. 点击基础模型上的省略号(...)并选择克隆。这会创建一个包含所有设置的副本。
  4. 将克隆重命名为你的策展产品名(例如 "Company Assistant")。按需更新头像、系统提示词、知识库和工具。
  5. 将策展模型的访问权限设置为公开(或限制为应看到它的用户组)。

现在高级用户可以直接看到和使用原始基础模型,而普通用户只能看到策展模型。两个条目都指向同一个上游 LLM,但配置相互独立。

升级上游模型

当你切换到更新的 LLM(例如 Qwen 3 → Qwen 3.5)时,在两个条目上都更新基础模型选择。你也可以使用导出导入来跨条目保持设置同步。

为什么不使用受限基础模型上的工作区模型?

工作区模型继承其基础模型的访问要求。如果用户没有基础模型的访问权限,他们将无法使用任何建立在其上的工作区模型——即使该工作区模型本身与他们共享。

这是有意为之。如果没有这个要求,任何人都可以通过在受限基础模型上创建工作区模型并公开共享来绕过基础模型的访问限制。那将是有缺陷的访问控制。

注意

如果你以前依赖工作区模型来让用户访问他们无法直接看到的基础模型,这种模式依赖于一个已被修补的访问控制漏洞。上述“双基础模型”模式在不存在安全问题的前提下达成相同效果。

备选方案:隐藏基础模型

如果你不需要差异可见性——即没有任何用户组需要在选择器中看到原始基础模型——可以使用更简单的方法:

  1. 将基础模型设置为公开(让所有人都有访问权限)。
  2. 隐藏基础模型(省略号 > 隐藏)使其不出现在模型选择器中。
  3. 在(现已隐藏的)基础模型之上创建一个工作区模型,并与你的用户共享。

用户只能看到工作区模型。隐藏的基础模型在底层可访问但在 UI 中不可见。管理员仍可通过直接 URL 参数访问隐藏模型。

当每个用户都应拥有相同体验时,这种方法有效。当某些用户组需要在其选择器中直接访问基础模型时,它适用。


局限性

预设而非微调

模型预设通过系统提示词和工具绑定配置行为。它们不修改底层模型权重。对于深层行为更改,您需要实际的微调。

回退需要配置

如果基础模型不可用,预设将会失败,除非将 ENABLE_CUSTOM_MODEL_FALLBACK 设置为 True 并在管理面板 > 设置 > 模型中配置了默认模型。

本内容仅供参考,不构成任何保证、担保或合同承诺。Open WebUI 按“现状”提供。请参阅您的许可协议 以了解适用条款。