更新时间:

#RAG DeepSeek+本地知识库部署

什么是RAG系统? 简而言之,RAG系统通过整合大型语言模型(LLM)与外部知识源,实现了能力的显著提升。这种整合机制使得模型能够动态地引入相关信息,从而生成既连贯又准确,且与上下文高度相关的回应。RAG系统的核心组件包括:

检索器(Retriever):负责从外部知识库中高效提取与查询相关的数据。 生成器(Generator):利用LLM将检索到的信息融合,生成接近人类表达的回应。 通过结合这些组件,RAG系统能够提供基于实时数据而非仅依赖预训练知识的答案,有效解决了预训练知识可能迅速过时的问题以及大模型幻觉问题。

#总体数据流程

#1. 安装 ollama

https://github.com/ollama/ollama 直接安装

curl http://localhost:11434/. check ollama running

https://ollama.com/library/deepseek-r1 模型仓库,类似 dockerhub

#2. 拉取模型

 ollama run deepseek-r1:8b 看好内存大小,也可以 deepseek-r1:32b

如果拉不下来,速度变慢、卡住,关闭,重新拉(会续传)

剩余参考这篇文章 : https://mp.weixin.qq.com/s/IKoBga2iKfpkdD4Qgy8iLg

#3. ollama pull bge-m3 下载向量化模型, 用来把知识库向量化

#4. 安装 cherry-studio 借助它 ui 页面操作

#下载 cherry studio

根据自己的环境下载 cherry studio

#配置本地 ollama

#操作步骤:

找到左下角设置图标 选择模型服务 选择 ollama 点击管理 点击模型后面的加号(会自动查找到本地安装的模型) 减号表示已经选择了

#知识库配置

 1.选择知识库 2.选择添加 3.选择嵌入模型 4.填写知识库名称

#添加知识文档

cherry 可以添加文档,也可以添加目录(这个极其方便),添加完以后出现绿色的对号,表示向量化完成。

#搜索验证

 点击搜索知识库 输入搜索顺序 点击搜索 大家可以看下我搜索的内容和并没有完全匹配,不过已经和意境关联上了。

#大模型处理

 点击左上角的聊天图标 点击助手 点击默认助手(你也可以添加助手) 选择大模型 选择本地 deepseek,也可以选择自己已经开通的在线服务 设置知识库(不设置不会参考) 输入提问内容

#发问

大家可以看到 deepseek 已经把结果整理了,并告诉了我们参考了哪些资料。

#满血版 API

自己本地模型体验后,可以切换到硅基流动 在线 api ,感觉明显质量不同...😄

如果你的知识库有隐私数据,不要联网!