qagent
该项目旨在展示一个更简单、更实用的方法来构建领域特定问答代理,以替代传统的检索增强生成(RAG)系统。核心思想是利用现代搜索API结合大上下文窗口,在许多文档问答场景中取代复杂的RAG流程。
以下是该项目的主要功能、核心要点和关键特性:
- 智能工具选择: 根据查询需求自动选择快速搜索或全面抓取。
- 领域限制搜索: 仅搜索批准的组织文档网站,实现AI安全。
- 网页抓取后备方案: 当搜索结果不足时,全面抓取页面内容。
- 智能总结: 可选的AI驱动结果总结,减少60-80%的token使用量。
- 成本竞争力: 每次查询的成本为$0.005-$0.075,通常比传统的RAG系统更便宜。
- 性能优化: 快速搜索处理90%的查询,仅在需要时进行深度抓取。
- 数据安全: 无敏感数据发送到向量数据库或训练系统。
- 透明的来源: 每个答案都包含来自官方文档的清晰来源归属。
- 易于配置: 简单的CSV文件控制可以访问哪些知识来源。
- 对话记忆: 在会话中的多个问题之间保持上下文。
- 生产就绪: 具有适当的错误处理和日志记录的FastAPI后端。
该项目采用了搜索优先方法,智能回退到网页抓取,以进行全面信息检索。系统使用Gemini 2.0 Flash模型,并使用ReAct框架(工具选择 + 搜索)代替内部推理,从而降低成本和提升速度。