RAG
检索增强生成(RAG)让语言模型能够围绕外部内容——文档、知识库等——进行推理:先检索相关信息,再把它送入模型上下文。当结果不符合预期(例如模型“幻觉”或遗漏关键信息)时,问题往往并不在模型本身,而在上下文链路。
本 页汇总了最常见的 RAG 问题及其处理方法。
按场景推荐设置
RAG 性能很大程度上取决于你的模型配置。默认值较为保守以保证兼容性,但针对具体部署调优后效果会好得多。所有设置均在 管理员面板 > 设置 > 文档 中配置。
Agentic 检索:启用 kb_exec
如果你的模型使用 原生函数调用,设置 ENABLE_KB_EXEC=True 会让知识库体验明显更好。它会给模型提供一套类 shell 的接口(ls、tree、grep、cat、按行读)来操作知识内容,能力强的模型会以一种比单一搜索工具更可靠的方式把它们串起来。在 Default 模式下它没有任何效果。参见 类文件系统访问。