Manier om DeepSeek's 671B AI-model uit te voeren zonder dure GPU's ontdekt
DeepSeek-R1, gelanceerd op 20 januari 2025, is een 671B parameter Mixture-of-Experts (MoE) model met 37B actieve parameters per token. Het is ontworpen voor geavanceerd redeneren, ondersteunt 128K tokeninvoer en genereert tot 32K tokens. Dankzij de MoE-architectuur levert het topprestaties terwijl het minder bronnen gebruikt dan traditionele dichte modellen.
Onafhankelijke tests tonen aan dat het R1 taalmodel prestaties levert die vergelijkbaar zijn met OpenAI's O1, waardoor het een concurrerend alternatief is voor AI-toepassingen waar veel op het spel staat. Laten we eens kijken wat we nodig hebben om lokaal uit te voeren.
De hardware
Deze build draait om dubbele AMD Epyc CPU's en 768GB DDR5 RAM-geen dure GPU's nodig.
- Behuizing: Enthoo Pro 2 Server
- Moederbord: Gigabyte MZ73-LM0 of MZ73-LM1 (heeft twee CPU-slots & 24 RAM-slots)
- CPU: 2x AMD Epyc 9004/9005 (9115 of 9015 werken als meer budgetvriendelijke opties)
- Koeling: Arctic Freezer 4U-SP5
- RAM: 24x 32GB DDR5 RDIMM (768 GB totaal)
- Opslag: 1TB+ NVMe SSD (om snel 700 GB aan modelgewichten te laden)
- Voeding: Corsair HX1000i (1000W, ruim voldoende voor dubbele CPU's)
Software & Installatie
Eenmaal geassembleerd, Linux en llama.cpp geïnstalleerd worden geïnstalleerd worden om het model te kunnen draaien. Een cruciale BIOS-tweak, NUMA-groepen op 0 instellen, verdubbelt de RAM-efficiëntie voor betere prestaties. De volledige 700GB aan DeepSeek-R1-gewichten kan worden gedownload https://huggingface.co/unsloth/DeepSeek-R1-GGUF/tree/mainvan Hugging Face.
Prestaties
Deze opstelling genereert 6-8 tokens per seconde - niet slecht voor een volledig lokaal high-end AI-model. GPU wordt volledig overgeslagen, maar dat is opzettelijk. Voor Q8 quantisatie (voor hoge kwaliteit) op GPU's zou meer dan 700GB VRAM nodig zijn, wat meer dan $100K zou kosten. Ondanks de ruwe kracht verbruikt het hele systeem minder dan 400W, waardoor het verrassend efficiënt is.
Voor degenen die volledige controle willen over grensverleggende AI, geen cloud, geen beperkingen, is dit een gamechanger. Het bewijst dat high-end AI lokaal kan worden uitgevoerd, op een volledig open-source manier, terwijl gegevensprivacy prioriteit krijgt, de kwetsbaarheid voor inbreuken wordt geminimaliseerd en de afhankelijkheid van externe systemen wordt geëlimineerd.
Bron(nen)
Matthew Carrigan op X, Docsbot, DeepSeekteaserafbeelding: Pixabay
Top 10 Testrapporten
» Top 10 Multimedia Notebooks
» Top 10 Gaming-Notebooks
» Top 10 Budget Gaming Laptops
» Top 10 Lichtgewicht Gaming-Notebooks
» Top 10 Premium Office/Business-Notebooks
» Top 10 Budget Office/Business-Notebooks
» Top 10 Workstation-Laptops
» Top 10 Subnotebooks
» Top 10 Ultrabooks
» Top 10 Notebooks tot €300
» Top 10 Notebooks tot €500
» Top 10 Notebooks tot € 1.000De beste notebookbeeldschermen zoals getest door Notebookcheck
» De beste notebookbeeldschermen
» Top Windows Alternatieven voor de MacBook Pro 13
» Top Windows Alternatieven voor de MacBook Pro 15
» Top Windows alternatieven voor de MacBook 12 en Air
» Top 10 best verkopende notebooks op Amazon
» Top 10 Convertible Notebooks
» Top 10 Tablets
» Top 10 Tablets tot € 250
» Top 10 Smartphones
» Top 10 Phablets (>90cm²)
» Top 10 Camera Smartphones
» Top 10 Smartphones tot €500
» Top 10 best verkopende smartphones op Amazon