xAI lanceert Grok 3 AI met topprestaties en bètaredeneringsmodellen

xAI lanceert de Grok 3-familie van toonaangevende AI. (Afbeeldingsbron: xAI)

De nieuwste xAI grote taalmodellen hebben de benchmarktabellen aangevoerd dankzij hun vermogen om op het internet naar informatie te zoeken, complexe problemen te beredeneren en input te verwerken met een contextvenster van een miljoen tokens. Grok 3 modellen hebben OpenAI GPT-4o en DeepSeek-V3 op de meeste benchmarks verslagen.

David Chien (vertaald door Ninh Duy), Gepubliceerd 21-02-2025 🇺🇸 🇩🇪 ...

AI Software Launch

XAI van Elon Musk heeft de Grok 3-familie van toonaangevende AI-modellen voor grote talen gelanceerd, die over het algemeen beter presteren dan andere AI's op gestandaardiseerde AI-benchmarks.

De Grok 3 modellen zijn getraind op het Colossus supercomputercluster van het bedrijf dat 100.000 Nvidia Hopper Tensor Core GPU's gebruikt. Er zijn een paar standaard en mini niet-redeneringsmodellen (Grok 3 beta en Grok 3 mini beta) uitgebracht, samen met een paar redeneringsmodellen (Grok 3 beta (Think) en Grok 3 mini beta (Think)).

De niet-redenerende modellen presteren over het algemeen beter dan de eerdere top-AI's, zoals OpenAI GPT-4o en DeepSeek-V3. Eén reden hiervoor is dat ze een contextvenster van een miljoen token hebben, waardoor de AI zeer grote hoeveelheden tekst kan gebruiken. Dit verbetert het vermogen van de modellen om het juiste antwoord uit verschillende bronnen te halen. Dat gezegd hebbende, de Grok 3 beta modellen beantwoorden vragen over feiten nog steeds met minder dan 50% nauwkeurigheid (SimpleQA benchmark), dus mensen zullen morgen nog steeds werk hebben.

De redeneringsmodellen doordenken complexe vragen stap voor stap, zodat de gebruiker het denkproces van de AI kan zien. Hierdoor kunnen deze AI's problemen oplossen zoals een expert dat zou doen door kleinere delen van het probleem op te lossen en de resultaten te combineren voor een goed antwoord. Als u de DeepSearch agent, of zoekoptie, selecteert, zal Grok 3 breed en diep zoeken op het internet en code-interpreters gebruiken voordat er rapporten worden gegenereerd die de bevindingen samenvatten. De Grok 3 (Think) modellen presteren over het algemeen het beste bij het oplossen van wiskundeproblemen, het beantwoorden van meerkeuzevragen op universitair niveau en het uitvoeren van coderingstaken in vergelijking met andere AI.

xAI verwacht Grok 3 de komende maanden verder te tunen voor betere prestaties op een 200.000-GPU supercomputercluster. Grok 3 is nu beschikbaar voor alle gebruikers op X en Grok.com. Gratis gebruikers kunnen te maken krijgen met gebruiksbeperkingen, terwijl betalende gebruikers toegang krijgen tot geavanceerde functies.