我们先看看搭建完知识库的效果,使用deepseek问答的时候会出现红色框中的引用内容,如果没有知识库是不出现此处引用内容的。
图片
一、什么是RAG知识库?RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合检索和生成的先进自然语言处理(NLP)技术,用于提升生成模型的能力。它通过引入外部知识库或文档检索机制,增强了生成模型的准确性和信息丰富性,特别适用于需要结合外部知识的任务,比如问答、对话系统和知识密集型文本生成。
1. RAG 的核心原理
传统的 LLM 只能依赖训练时的知识,容易受到知识时效性和模型参数大小的限制。而 RAG 通过实时检索外部知识,使得 AI 在回答问题时更加精准和可控。
RAG 的工作流程一般如下:
Step 1 - 检索(Retrieval):
先从本地知识库(如企业文档、PDF、数据库)或外部数据源(如维基百科、API)中提取与问题相关的内容。
使用 向量数据库(Vector Database) 进行高效搜索,例如 FAISS、Milvus、ChromaDB 等。
Step 2 - 生成(Generation):
将检索到的内容作为上下文输入给 LLM(如 DeepSeek、GPT-4、Llama2)。
LLM 结合检索的知识,生成更精准、更符合事实的回答。
2.RAG 知识库的应用场景
✅ 企业智能客服:快速从 FAQ、合同、产品手册中检索答案,自动回复客户问题。✅ 医疗健康助手:从医学论文和病例数据中检索信息,提供专业医学建议。✅ 法务咨询:结合法律法规和案例,辅助律师进行法规检索和文书生成。✅ 个人知识管理:打造本地 AI 知识库,管理笔记、文档、书籍等信息。
二、为什么需要 RAG?图片
三、具体搭建实操步骤1.准备工作:以下需要的软件和账号已经在上一篇文章中介绍,动动你的小手翻上一篇,不在赘述。
1、下载Cherry Studio可视化工具
2、注册硅基流动账号
3、部署DeepSeek模型 + Embedding模型
下面开始正式搭建 硅基流动+Cherry Studio本地私有知识库。
2.步骤如下:2.1、新建API秘钥,名字随便。图片
图片
然后点击 API 秘钥会自动进行复制,
图片
2.2、检查API密钥是否有效打开Cherry Studio客户端,点击左下角【设置】——》将复制的API秘钥填写进去即可。
图片
点击右边的检查,选择检测的模型,会提示成功还是失败,当提示成功表示可以使用
图片
图片
如果密钥有效,会提示连接成功。
图片
2.3、添加DeepSeek推理模型点击底部的 【管理按钮】,在模型管理服务中查找模型,点击【全部】默认就能看到;图片
找到需要的模型,点击右侧【+】添加到我的模型。图片
2.4、添加Embeding嵌入模型我们需要添加嵌入式模型,否者无法使用知识库功能(这5个模型都添加上)。
图片
注意:Pro/BAAI/bge-m3模型是收费模型,其他4个模型是免费的。
2.5、 创建知识库知识库入口:在 CherryStudio 左侧工具栏,点击知识库图标,即可进入管理页面;图片
添加知识库:点击添加,名称:输入知识库的名称,嵌入模型: BAAI/bge-m3 ,完成创建。图片
2.6、添加文件并向量化添加文件: 点击添加文件的按钮,打开文件选择;选择文件,或者目录,或者网站等多种形式。图片
系统会自动进行向量化处理,当显示完成时(绿色 ✓),代表向量化已完成
其他的网站、网址、笔记等形式可以自行设置。
2.7、 搜索知识库当文件等资料向量化完成后,即可进行查询:
图片
图片
2.8、 对话中引用知识库生成回复创建一个新的话题,在对话工具栏中,点击知识库,会展开已经创建的知识库列表,选择需要引用的知识库;输入并发送问题,模型即返回通过检索结果生成的答案 ;同时,引用的数据来源会附在答案下方,可快捷查看源文件。图片
图片
OK到这里已经配置完成了。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。