如何给本地部署的DeepSeek投喂数据,让他学习你的一切,让他比你更懂你自己!
大家好,我是土叔,今天给大家分享一篇不错的deepseek本地部署教程。
写在前面
在上一篇文章中,我们说了怎么在本地部署DeepSeek。对本地部署DeepSeek感兴趣的小伙伴看过来。
本地部署 DeepSeek:小白也能轻松搞定!
话说回来了,为啥要本地部署呢?
① 在使用DeepSeek中,经常会出现服务器繁忙,请稍后再试。
② 不想让个人隐私数据暴露出去
③ 可以将各种格式的文件,如pdf、csv、txt、md 格式的数据投喂给它。比如你想让 DeepSeek 了解你的公司业务,就把相关的文档上传给它。
DeepSeek 就能吃下你给它的各种"知识大餐",然后变得更聪明,更懂你
工具介绍
RAG(Retrieval-Augmented Generation,检索增强生成)是一种让AI模型能够访问外部知识库的技术。通过RAG技术,你可以将PDF、CSV、TXT、MD等格式的文件上传给DeepSeek,增强其知识储备和回答准确性。RAG技术通过文本嵌入模型将各种格式的数据量化成DeepSeek认识的数据,让DeepSeek能够学习这些知识,并在回答问题时提取相关信息。
主要特点:
- 数据投喂:可以将各种格式的文件投喂给DeepSeek
- 知识增强:增强DeepSeek的知识储备和回答准确性
- 隐私保护:本地运行,保护个人隐私数据
- 多格式支持:支持PDF、CSV、TXT、MD等多种格式
- 量化工具:使用文本嵌入模型量化数据
- 学习能力强:DeepSeek能够学习投喂的知识
- 回答准确:通过检索外部数据增强回答准确性
- 免费使用:完全免费,无需付费
- 开源工具:使用开源的nomic-embed-text工具
- 易于使用:操作简单,易于上手
适用场景:
- 需要让DeepSeek了解公司业务的用户
- 需要让DeepSeek学习专业知识的用户
- 需要让DeepSeek处理文档的用户
- 需要让DeepSeek回答专业问题的用户
- 需要让DeepSeek生成代码的用户
- 需要让DeepSeek进行数据分析的用户
- 需要保护个人隐私的用户
使用方法:
- 拉取nomic-embed-text工具
- 在WebUI中设置文本嵌入模型
- 准备要投喂的数据
- 添加新知识
- 与DeepSeek对话,验证学习效果
使用技巧:
- 可以使用多种格式的数据投喂,满足不同需求
- 可以使用文本嵌入模型,量化数据
- 可以使用WebUI,提升使用体验
- 可以使用快捷键,快速打开WebUI
一、RAG是什么?
为了投喂数据,我们要用到RAG。首先,我们先来了解下什么是RAG?
我们就问问昨天部署好的DeepSeek好了。
首先我们在命令行输入:ollama run deepseek-r1:1.5b 命令,启动DeepSeek
然后打开浏览器并输入快捷键:ctrl+shift+l 调出WebUI可视化AI界面
输入:RAG是什么?
翻译成大白话就是:我们把知识放到知识库里,然后把它投喂给人工智能。我们需要用一个量化的工具,把各种格式的数据量化给人工智能,让它能看得懂。
人工智能通过对这些知识的学习后,以后你再问它的时候,他就能将知识提取出来,加工处理后回答你的问题。
RAG 就是让 DeepSeek 不仅能靠自己的知识库回答问题,还能通过检索外部数据来增强回答的准确性和丰富性。就好比你考试时偷偷带了小抄,但 DeepSeek 是光明正大地"作弊",还能把答案说得头头是道。
二、 拉取nomic-embed-text
刚说了RAG是啥?我们需要一个RAG工具来完成量化工作。
各种开源免费的RAG工具挺多,我们这里选择最近比较获得ollama 提供的nomic-embed-text。
https://ollama.com/library/nomic-embed-text
我们使用上面圈出来的命令拉取即可,274M,大约1min左右就可以下完,出现【success】字样表示下载成功。
三、RAG设置
打开WebUI界面,我们会看到一个RAG设置文本嵌入模型。
文本嵌入模型就是把我们投喂的各种文档数据量化成DeepSeek认识的数据。
四、添加新知识
工具都准备好后,我们开始准备给DeepSeek投喂数据……
① 投喂前不认识晓凡
在投喂数据之前,我们问问它认不认识晓凡。结果不用我说了,肯定是不知道的
② 准备投喂的数据
接下来,将晓凡事先准备好的关于晓凡的简介【程序员晓凡.md】文档投喂给它,文档内容如下。
③ 投喂数据
④ 投喂完成后,已经认识晓凡了
五、其他数据投喂测试
我们准备一个【学生选课系统接口文档 V1.1.md】接口文档
按照上面方法进行投喂
接下来,我们我们让DeepSeek 用Java语言实现【获取学生选课信息】这一接口功能
本期内容到这儿就结束了,希望对您有所帮助。
软件对比
RAG与其他AI增强技术对比
| 特性 | RAG | Fine-tuning | Prompt Engineering | Knowledge Graph |
|---|---|---|---|---|
| 数据投喂 | ★★★★★ | ★★★★ | ★☆☆☆☆ | ★★★★ |
| 知识增强 | ★★★★★ | ★★★★★ | ★★★☆☆ | ★★★★★ |
| 隐私保护 | ★★★★★ | ★★★★ | ★★★★★ | ★★★★★ |
| 多格式支持 | ★★★★★ | ★★★★ | ★★★★ | ★★★☆☆ |
| 量化工具 | ★★★★★ | ★☆☆☆☆ | ★☆☆☆☆ | ★★★★ |
| 学习能力强 | ★★★★★ | ★★★★★ | ★★★☆☆ | ★★★★ |
| 回答准确 | ★★★★★ | ★★★★★ | ★★★☆☆ | ★★★★★ |
| 免费使用 | ★★★★★ | ★★★★ | ★★★★★ | ★★★★ |
| 开源工具 | ★★★★★ | ★★★★ | ★★★★★ | ★★★★ |
| 易于使用 | ★★★★★ | ★★★☆☆ | ★★★★★ | ★★★☆☆ |
总结:
- RAG:数据投喂、知识增强、隐私保护,适合需要投喂数据给AI的用户
- Fine-tuning:知识增强、学习能力强,但需要大量数据,适合需要深度定制AI的用户
- Prompt Engineering:隐私保护、易于使用,但知识增强有限,适合需要简单增强AI的用户
- Knowledge Graph:知识增强、回答准确,但多格式支持有限,适合需要结构化知识的用户
使用建议
- 公司业务:如果需要让DeepSeek了解公司业务,推荐使用RAG技术
- 专业知识:如果需要让DeepSeek学习专业知识,推荐使用RAG技术
- 文档处理:如果需要让DeepSeek处理文档,推荐使用RAG技术
- 专业问题:如果需要让DeepSeek回答专业问题,推荐使用RAG技术
- 代码生成:如果需要让DeepSeek生成代码,推荐使用RAG技术
使用技巧
1. 提升投喂效果
- 使用多种格式的数据投喂,满足不同需求
- 使用高质量的数据投喂,提升学习效果
- 使用结构化的数据投喂,提升学习效果
- 使用相关的数据投喂,提升学习效果
2. 提升使用体验
- 使用WebUI,提升使用体验
- 使用快捷键,快速打开WebUI
- 使用文本嵌入模型,量化数据
- 使用多种格式,满足不同需求
3. 节省系统资源
- 使用轻量级的文本嵌入模型,节省系统资源
- 使用适量的数据投喂,节省系统资源
- 定期清理缓存,节省系统资源
- 及时关闭WebUI,节省系统资源
4. 解决投喂问题
- 检查nomic-embed-text是否拉取,确保nomic-embed-text拉取
- 检查文本嵌入模型是否设置,确保文本嵌入模型设置
- 检查数据格式是否正确,确保数据格式正确
- 检查数据是否投喂成功,确保数据投喂成功
常见问题
1. RAG是什么?
- RAG(Retrieval-Augmented Generation,检索增强生成)是一种让AI模型能够访问外部知识库的技术。
2. 如何拉取nomic-embed-text?
- 命令行输入:ollama pull nomic-embed-text 拉取nomic-embed-text。
3. 如何设置文本嵌入模型?
- 打开WebUI界面,在RAG设置中选择文本嵌入模型。
4. 如何投喂数据?
- 在WebUI界面中,点击添加新知识,选择要投喂的数据文件。
5. 支持哪些格式?
- 支持PDF、CSV、TXT、MD等多种格式。
6. 如何验证学习效果?
- 与DeepSeek对话,询问投喂的数据相关的问题,验证学习效果。
7. RAG是免费的吗?
- 是的,RAG完全免费。
8. RAG需要什么配置?
- RAG需要本地部署DeepSeek和nomic-embed-text工具。
注意事项
软件使用前准备:
- 确保本地部署DeepSeek
- 确保拉取nomic-embed-text工具
- 确保网络连接正常
- 确保硬盘空间充足
软件使用过程中:
- 注意数据格式,确保数据格式正确
- 注意数据质量,使用高质量的数据
- 注意数据相关性,使用相关的数据
- 注意数据数量,使用适量的数据
软件使用完成后:
- 及时关闭WebUI,节省系统资源
- 清理缓存,释放存储空间
- 关闭DeepSeek服务,节省系统资源
安全问题:
- 不要投喂敏感数据
- 不要在不安全的网络环境下使用
- 注意保护个人隐私,不要泄露敏感信息
- 注意数据安全,保护重要数据
版权问题:
- 尊重版权,不要投喂盗版数据
- 不要传播盗版数据
- 不要用于商业用途,除非获得授权
- 注意保护个人隐私,不要泄露敏感信息
小结
通过RAG技术,你可以将各种格式的文件投喂给DeepSeek,增强其知识储备和回答准确性。RAG技术通过文本嵌入模型将各种格式的数据量化成DeepSeek认识的数据,让DeepSeek能够学习这些知识,并在回答问题时提取相关信息。
总结:
- 数据投喂:可以将各种格式的文件投喂给DeepSeek
- 知识增强:增强DeepSeek的知识储备和回答准确性
- 隐私保护:本地运行,保护个人隐私数据
- 多格式支持:支持PDF、CSV、TXT、MD等多种格式
- 量化工具:使用文本嵌入模型量化数据
- 学习能力强:DeepSeek能够学习投喂的知识
使用建议:
- 公司业务推荐使用RAG技术
- 专业知识推荐使用RAG技术
- 文档处理推荐使用RAG技术
- 专业问题推荐使用RAG技术
- 代码生成推荐使用RAG技术
DeepSeek本地部署安装包下载链接
原文来自:https://www.cnblogs.com/xiezhr/p/18714692
想要及时了解更多好玩有趣的网站、实用的软件,扫码关注公众号,就不会错过精彩的推荐啦。
- Author: 土叔分享
- Link: https://www.tushushare.com/categories/software/deekseek-local-2/
- License: This work is under a 知识共享署名-非商业性使用. Kindly fulfill the requirements of the aforementioned License when adapting or creating a derivative of this work.















