更新时间： 2025-02-06 23:56:09

#RAG DeepSeek+本地知识库部署

什么是RAG系统？简而言之，RAG系统通过整合大型语言模型（LLM）与外部知识源，实现了能力的显著提升。这种整合机制使得模型能够动态地引入相关信息，从而生成既连贯又准确，且与上下文高度相关的回应。RAG系统的核心组件包括：

检索器（Retriever）：负责从外部知识库中高效提取与查询相关的数据。生成器（Generator）：利用LLM将检索到的信息融合，生成接近人类表达的回应。通过结合这些组件，RAG系统能够提供基于实时数据而非仅依赖预训练知识的答案，有效解决了预训练知识可能迅速过时的问题以及大模型幻觉问题。

#总体数据流程

curl http://localhost:11434/. check ollama running

ollama run deepseek-r1:8b 看好内存大小，也可以 deepseek-r1:32b

如果拉不下来，速度变慢、卡住，关闭，重新拉（会续传）

剩余参考这篇文章 : https://mp.weixin.qq.com/s/IKoBga2iKfpkdD4Qgy8iLg

根据自己的环境下载 cherry studio

找到左下角设置图标选择模型服务选择 ollama 点击管理点击模型后面的加号（会自动查找到本地安装的模型）减号表示已经选择了

1.选择知识库 2.选择添加 3.选择嵌入模型 4.填写知识库名称

cherry 可以添加文档，也可以添加目录（这个极其方便），添加完以后出现绿色的对号，表示向量化完成。

点击搜索知识库输入搜索顺序点击搜索大家可以看下我搜索的内容和并没有完全匹配，不过已经和意境关联上了。

点击左上角的聊天图标点击助手点击默认助手（你也可以添加助手）选择大模型选择本地 deepseek，也可以选择自己已经开通的在线服务设置知识库（不设置不会参考）输入提问内容

大家可以看到 deepseek 已经把结果整理了，并告诉了我们参考了哪些资料。

自己本地模型体验后，可以切换到硅基流动在线 api ，感觉明显质量不同...😄

如果你的知识库有隐私数据，不要联网！