很多人想把 DeepSeek 大模型装在自己电脑上,不上网、隐私安全、随时能用。但不知道自己的电脑能不能跑、要什么配置才够。下面我用大白话讲清楚,从最低能跑到流畅好用,再到省钱量化方案,一次性说明白。

一、先搞懂:DeepSeek 有哪些版本?
本地能跑的主要是 R1 系列(推理 / 日常聊天)和 V3/V4(通用大模型)。个人电脑最常装的是:
1.5B:超轻量,老笔记本也能跑
7B:最均衡,中文好、速度快、要求不高
14B:推理强、写代码 / 做数学很稳
32B:能力接近 GPT-4,要高配显卡
70B+ / V4(1.6T):个人电脑基本别想,得服务器集群
二、最低配置(能跑就行,偏卡)
1.5B(入门,老电脑 / 笔记本)
显卡(GPU):
无独显也能跑(纯 CPU,慢)
独显最低:GTX 1050 / 1060(6GB 显存)
内存(RAM):8GB起步,推荐 16GB
存储:NVMe SSD 20GB+ 空闲(机械盘太慢)
系统:Windows 10/11、Linux、macOS(M1/M2 也行)
特点:秒回、简单聊天 / 讲故事够用,逻辑弱
7B(主流,普通台式 / 游戏本)
显卡:6GB 显存最低(GTX 1060/1660、RTX 2060/3050);推荐 8GB+(RTX 3060/4060)
内存:16GB必须,32GB 更稳
存储:NVMe SSD 30GB+
特点:中文理解好、日常聊天 / 文案 / 简单代码都能搞定,性价比最高
三、推荐配置(流畅好用,体验最佳)
14B(强推理,写代码 / 做数学)
显卡:12GB 显存起步(RTX 3080/4070、AMD RX 6800);推荐 24GB+(RTX 4090/5090D)
内存:32GB起步,64GB 更稳
存储:NVMe SSD 50GB+
特点:数学、逻辑、代码很强,接近专业工具
32B(旗舰体验,接近 GPT-4)
显卡:24GB 显存最低(RTX 4090、A10G);推荐多卡(2×RTX 4090)
内存:64GB起步,128GB 更稳
存储:NVMe SSD 100GB+
特点:长文本、复杂推理、专业文档都能处理
四、省钱关键:量化(低配也能跑大模型)
如果显存不够,用 4-bit 量化(Q4),显存占用直接降到原来的 1/4,精度损失很小(约 5%-8%)36氪。
7B Q4:仅需 4-5GB 显存,GTX 1060 也能流畅跑36氪14B Q4:仅需 8-10GB 显存,RTX 3060 轻松跑
32B Q4:仅需 16-20GB 显存,RTX 4070/4080 可跑
一句话总结:想省钱就用 Q4 量化,7B/14B 最香。
五、CPU-only 配置(无独显,纯 CPU 跑)
1.5B:8GB 内存、4 核 CPU(i5/R5),能跑但慢(约 1-2 字 / 秒)
7B:16GB 内存、6 核以上 CPU,勉强能用,不推荐长期用
六、避坑提醒(新手常犯)
只看显存,别只看显卡型号:比如 RTX 3060(8GB)比 GTX 1660(6GB)强,但显存不够再强也跑不了36氪。
必须 NVMe SSD:机械硬盘(HDD)加载要几十分钟,还容易卡死。
系统盘留足空间:C 盘至少 50GB 空闲,避免虚拟内存不足。
七、直接给你 3 套方案(照着买 / 升级)
方案 1:预算有限(3000-5000 元)
显卡:RTX 3060 12GB(二手)
内存:32GB DDR4
存储:500GB NVMe SSD
能跑:7B 满血、14B Q4,日常足够
方案 2:主流均衡(6000-10000 元)
显卡:RTX 4070Ti Super 16GB
内存:64GB DDR5
存储:1TB NVMe SSD
能跑:14B 满血、32B Q4,专业级体验
方案 3:一步到位(15000 元 +)
显卡:RTX 4090 24GB
内存:128GB DDR5
存储:2TB NVMe SSD
能跑:32B 满血、70B Q4,本地旗舰