IBM lanceert Granite 3.0 open-source AI-modellen voor bedrijven

IBM Granite 3.0 open-source AI-modellen voor bedrijven nu beschikbaar (Beeldbron: IBM)

De IBM Granite 3.0 familie van AI-modellen valt onder de voorwaarden van de Apache 2.0 licentie, is gericht op zakelijke klanten en biedt topprestaties naast (naar verluidt) de meest uitgebreide set risico- en schadedetectiemogelijkheden op de markt. Geïnteresseerden kunnen de modellen downloaden van Hugging Face.

Codrut Nistor (vertaald door Ninh Duy), Gepubliceerd 22-10-2024 🇺🇸 🇫🇷 ...

Eerder vandaag onthulde IBM zijn meest geavanceerde familie AI-modellen tot nu toe, waarmee het versienummer van Granite op 3.0 komt. In september 2023 introduceerde IBM de Granite foundation modellenen nu schakelen ze de familie om naar een open-source model, terwijl ze tegelijkertijd elk ander aspect verbeteren. Alle (later te noemen) Granite 3.0-modellen vallen onder de voorwaarden van de Apache 2.0-licentie, waardoor zowel zakelijke klanten als de gemeenschap als geheel er hun voordeel mee kunnen doen.

De drie takken van Granite 3.0 en de leden van elke tak zijn de volgende:

Algemeen/Taal: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
Leuningen & Veiligheid: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
Mengsel van deskundigen: Graniet 3.0 3B-A800M Instruct, Graniet 3.0 1B-A400M Instruct, Graniet 3.0 3B-A800M Base, Graniet 3.0 1B-A400M Base

In tegenstelling tot hun concurrenten, die getraind worden op openbare gegevens, maken de Granite-modellen van IBM gebruik van bedrijfsgegevens en kunnen ze eenvoudig geïntegreerd worden in verschillende workflows en bedrijfsomgevingen, waardoor de kosten tot 23 keer lager uitvallen dan bij grote frontier-modellen. Volgens IBM werden voor de training van deze nieuwe modellen meer dan 12 biljoen tokens gebruikt op gegevens uit 12 verschillende natuurlijke talen en 116 verschillende programmeertalen.

Een van de hoogtepunten van de familie is Guardian 3.0, dat marktleidende risico- en schadedetectie biedt, waarbij rekening wordt gehouden met geaardheid, contextrelevantie en antwoordrelevantie bovenop de al veelvoorkomende attributen zoals sociale vooringenomenheid, haat, toxiciteit, godslastering, geweld, jailbreaking, enzovoort.

Degenen die aan de slag willen met IBM's Granite 3.0 (of willen overstappen op de nieuwe stukken code) kunnen naar Hugging Face gaan en ze ophalen. Terwijl een selectie van modellen op Nvidia's NIM microservices en Google Cloud Vertex AI Model Garden integraties met Hugging Face zal komen, zijn de instructievarianten van de nieuwe Granite 3.0 8B en 2B taalmodellen en de Granite Guardian 3.0 8B en 2B modellen beschikbaar voor commercieel gebruik via het IBM watsonx platform.

Eind augustus publiceerde Clifford A. Pickover Artificial Intelligence: Een geïllustreerde geschiedenis: From Medieval Robots to Neural Networks, een boek dat nu verkrijgbaar is voor $8,99 in Kindle formaat en voor $17,26 in paperback versie.

Bron(nen)

IBM Nieuws

▶ ▼ Persbericht

IBM introduceert Granite 3.0: Sterk presterende AI-modellen, gebouwd voor bedrijven

- Nieuwe Granite 3.0 8B & 2B modellen, vrijgegeven onder de permissieve Apache 2.0 licentie, laten sterke prestaties zien in vele academische en bedrijfsbenchmarks, in staat om modellen van vergelijkbare grootte te overtreffen of te evenaren

- De nieuwe Granite Guardian 3.0-modellen bieden IBM's meest uitgebreide afschermingsmogelijkheden om veilige en betrouwbare AI te bevorderen

- Nieuwe Granite 3.0 Mixture-of-Experts-modellen zorgen voor extreem efficiënte inferentie en lage latentie, geschikt voor CPU-gebaseerde implementaties en edge computing

- Het nieuwe Granite Time Series-model levert topprestaties op het gebied van zero/few-shot voorspellingen en presteert beter dan modellen die 10 keer groter zijn

- IBM onthult de volgende generatie van Granite-gestuurde watsonx Code Assistant voor algemene codering; debuteert nieuwe tools in watsonx.ai voor het bouwen en implementeren van AI-toepassingen en agents

- Kondigt aan dat Granite het standaardmodel wordt van Consulting Advantage, een AI-gestuurd leveringsplatform dat door de 160.000 consultants van IBM wordt gebruikt om nieuwe oplossingen sneller bij klanten te brengen

ARMONK, N.Y., 21 oktober 2024 /PRNewswire/ -- Vandaag, op IBM's (NYSE: IBM) het jaarlijkse TechXchange-evenement van IBM, kondigde het bedrijf de release aan van zijn meest geavanceerde reeks AI-modellen tot nu toe, Granite 3.0. IBM's derde generatie Granite flagship taalmodellen presteren beter dan of evenaren modellen van vergelijkbare grootte van toonaangevende modelleveranciers op vele academische en industriële benchmarks, en laten sterke prestaties, transparantie en veiligheid zien.

In overeenstemming met de toewijding van het bedrijf aan open-source AI, worden de Granite-modellen vrijgegeven onder de permissieve Apache 2.0-licentie, waardoor ze uniek zijn in de combinatie van prestaties, flexibiliteit en autonomie die ze bieden aan zakelijke klanten en de gemeenschap in het algemeen.

IBM's Granite 3.0 familie omvat:

Algemeen gebruik/taal: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
Leuningen en veiligheid: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
Mengsel van deskundigen: Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base

De nieuwe Granite 3.0 8B en 2B taalmodellen zijn ontworpen als 'werkpaard' modellen voor ondernemings-AI, die sterke prestaties leveren voor taken zoals Retrieval Augmented Geneneration (RAG), classificatie, samenvatten, entiteitsextractie en het gebruik van hulpmiddelen. Deze compacte, veelzijdige modellen zijn ontworpen om te worden afgestemd op bedrijfsgegevens en naadloos te worden geïntegreerd in verschillende bedrijfsomgevingen of workflows.

Hoewel veel grote taalmodellen (LLM's) getraind zijn op algemeen beschikbare gegevens, blijft een groot deel van de bedrijfsgegevens onbenut. Door een klein Granite-model te combineren met bedrijfsgegevens, vooral met behulp van de revolutionaire afstemmingstechniek InstructLab - die IBM en RedHat in mei introduceerden - gelooft IBM dat bedrijven taakspecifieke prestaties kunnen behalen die kunnen wedijveren met grotere modellen tegen een fractie van de kosten (gebaseerd op een waargenomen bereik van 3x-23x lagere kosten dan grote frontier-modellen in verschillende vroege ^{proofs-of-concept1}).

De Granite 3.0 release bevestigt opnieuw IBM's toewijding aan het opbouwen van transparantie, veiligheid en vertrouwen in AI-producten. De Granite 3.0 technisch rapport en gids voor verantwoord gebruik bevatten een beschrijving van de datasets die zijn gebruikt om deze modellen te trainen, details van de toegepaste filter-, opschonings- en curatiestappen, samen met uitgebreide resultaten van de modelprestaties in belangrijke academische en bedrijfsbenchmarks.

Van cruciaal belang is dat IBM een IP-vrijwaring biedt voor alle Granite-modellen op watsonx.ai, zodat zakelijke klanten met meer vertrouwen hun gegevens met de modellen kunnen samenvoegen.

De lat hoger leggen: Granite 3.0 benchmarks

De Granite 3.0 taalmodellen laten ook veelbelovende resultaten zien op het gebied van ruwe prestaties.

Op standaard academische benchmarks gedefinieerd door Hugging Face's OpenLLM Leaderboard, liggen de algemene prestaties van het Granite 3.0 8B Instruct-model gemiddeld boven die van open source modellen van vergelijkbare grootte van Meta en Mistral. In IBM's geavanceerde AttaQ-veiligheidsbenchmark is het Granite 3.0 8B Instruct-model op alle gemeten veiligheidsdimensies toonaangevend in vergelijking met modellen van Meta en Mistral^.2

Op de kerntaken van RAG, het gebruik van hulpmiddelen en taken in het Cybersecurity-domein presteert het Granite 3.0 8B Instruct-model gemiddeld beter dan open source-modellen van vergelijkbare grootte van Mistral en Meta^.3

De Granite 3.0-modellen werden getraind op meer dan 12 biljoen tokens op data uit 12 verschillende natuurlijke talen en 116 verschillende programmeertalen, met behulp van een nieuwe tweefasentrainingsmethode, waarbij gebruik werd gemaakt van de resultaten van duizenden experimenten die waren ontworpen om de datakwaliteit, dataselectie en trainingsparameters te optimaliseren. Tegen het einde van het jaar zullen de 3.0 8B en 2B taalmodellen naar verwachting ondersteuning bieden voor een uitgebreid 128K contextvenster en multimodale documentbegripcapaciteiten.

IBM, dat een uitstekende balans tussen prestaties en inferentiekosten laat zien, biedt zijn Granite Mixture of Experts (MoE) Architecture-modellen, Granite 3.0 1B-A400M en Granite 3.0 3B-A800M, aan als kleinere, lichtgewicht modellen die kunnen worden ingezet voor toepassingen met lage latency en CPU-gebaseerde implementaties.

IBM kondigt ook een bijgewerkte versie aan van zijn voorgetrainde Granite Time Series-modellen, waarvan de eerste versies eerder dit jaar werden uitgebracht. Deze nieuwe modellen zijn getraind op 3 keer meer data en leveren sterke prestaties op alle drie belangrijke tijdreeksbenchmarks, waarbij ze 10 keer grotere modellen van Google, Alibaba en anderen overtreffen. De bijgewerkte modellen bieden ook een grotere modelleringsflexibiliteit met ondersteuning voor externe variabelen en rolling forecasts^.4

Introductie van Granite Guardian 3.0: het volgende tijdperk van verantwoorde AI inluiden

Als onderdeel van deze release introduceert IBM ook een nieuwe reeks Granite Guardian-modellen waarmee applicatieontwikkelaars vangrails kunnen voorzien door gebruikersprompts en LLM-reacties te controleren op verschillende risico's. De Granite Guardian 3.0 8B en 2B modellen bieden de meest uitgebreide set aan risico- en schadedetectiemogelijkheden die momenteel op de markt verkrijgbaar is.

Naast schadedimensies zoals sociale vooroordelen, haat, toxiciteit, godslastering, geweld, jailbreaking en meer, bieden deze modellen ook een reeks unieke RAG-specifieke controles zoals geaardheid, contextrelevantie en antwoordrelevantie. In uitgebreide tests met 19 veiligheids- en RAG-benchmarks heeft het Granite Guardian 3.0 8B-model gemiddeld een hogere algehele nauwkeurigheid bij het detecteren van schade dan alle drie de generaties Llama Guard-modellen van Meta. Het liet ook gemiddelde prestaties zien in hallucinatiedetectie ten opzichte van gespecialiseerde hallucinatiedetectiemodellen WeCheck en MiniCheck^.5

Hoewel de Granite Guardian modellen afgeleid zijn van de corresponderende Granite taalmodellen, kunnen ze gebruikt worden om vangrails te implementeren naast alle open of propriëtaire AI-modellen.

Beschikbaarheid van Granite 3.0 modellen

De volledige suite van Granite 3.0 modellen en de bijgewerkte tijdreeksmodellen zijn beschikbaar voor download op HuggingFace onder de permissieve Apache 2.0 licentie. De instructievarianten van de nieuwe Granite 3.0 8B en 2B taalmodellen en de Granite Guardian 3.0 8B en 2B modellen zijn vanaf vandaag beschikbaar voor commercieel gebruik op IBM's watsonx platform. Een selectie van de Granite 3.0-modellen zal ook beschikbaar zijn als NVIDIA NIM microservices en via Google Cloud's Vertex AI Model Garden integraties met HuggingFace.

Om ontwikkelaars keuze en gebruiksgemak te bieden en lokale, edge implementaties te ondersteunen, is een gecureerde set van de Granite 3.0 modellen ook beschikbaar op Ollama en Replicate.

De nieuwste generatie Granite-modellen breidt IBM's robuuste open-source catalogus van krachtige LLM's uit. IBM heeft samengewerkt met ecosysteempartners zoals AWS, Docker, Domo, Qualcomm Technologies, Inc. via zijn Qualcomm® AI Hubsalesforce, SAPen anderen om verschillende Granite-modellen te integreren in het aanbod van deze partners of om Granite-modellen beschikbaar te maken op hun platforms, waardoor bedrijven over de hele wereld meer keuze krijgen.

Assistenten naar Agenten: de toekomst van ondernemings-AI realiseren

IBM bevordert Enterprise AI door middel van een spectrum aan technologieën - van modellen en assistenten tot de tools die nodig zijn om AI specifiek af te stemmen op en in te zetten voor de unieke data en use-cases van bedrijven. IBM maakt ook de weg vrij voor toekomstige AI-agenten die zichzelf kunnen sturen, kunnen nadenken en complexe taken kunnen uitvoeren in dynamische bedrijfsomgevingen.

IBM blijft zijn portfolio van AI-assistenttechnologieën ontwikkelen - van watsonx Orchestrate om bedrijven te helpen hun eigen assistenten te bouwen via low-code tooling en automatisering, tot een brede set vooraf gebouwde assistenten voor specifieke taken en domeinen zoals klantenservice, human resources, verkoop en marketing. Organisaties over de hele wereld hebben watsonx Assistant gebruikt om hen te helpen AI-assistenten te bouwen voor taken als het beantwoorden van routinevragen van klanten of werknemers, het moderniseren van hun mainframes en verouderde IT-toepassingen, het helpen van studenten bij het verkennen van mogelijke carrièrepaden, of het bieden van digitale hypotheekondersteuning voor huizenkopers.

Vandaag onthulde IBM ook de aankomende release van de volgende generatie van watsonx Code Assistantdie wordt aangestuurd door Granite-code-modellen en die universele codeerhulp biedt voor talen als C, C++, Go, Java en Python, met geavanceerde mogelijkheden voor het moderniseren van toepassingen voor Enterprise Java Applications^.6 De codecapaciteiten van Granite zijn nu ook toegankelijk via een uitbreiding voor Visual Studio Code, IBM Granite.Code.

IBM is ook van plan om nieuwe tools uit te brengen om ontwikkelaars te helpen aI efficiënter te bouwen, aan te passen en te implementeren via watsonx.ai - inclusief agentic frameworks, integraties met bestaande omgevingen en low-code automatiseringen voor veelvoorkomende use-cases zoals RAG en agents^.7

IBM richt zich op de ontwikkeling van AI-agenttechnologieën die in staat zijn tot meer autonomie, geavanceerd redeneren en probleemoplossing in meerdere stappen. De eerste release van het Granite 3.0 8B model biedt ondersteuning voor belangrijke agentcapaciteiten, zoals geavanceerd redeneren en een zeer gestructureerde chatsjabloon- en promptingstijl voor het implementeren van workflows voor toolgebruik. IBM is ook van plan om een nieuwe chatfunctie voor AI-agenten te introduceren in IBM watsonx Orchestrate, dat agentcapaciteiten gebruikt om AI-assistenten, vaardigheden en automatiseringen te orkestreren die gebruikers helpen om de productiviteit in hun teams te verhogen^.8 IBM is van plan om in 2025 agentcapaciteiten te blijven bouwen in het hele portfolio, inclusief vooraf gebouwde agents voor specifieke domeinen en use-cases.

Uitgebreid AI-gestuurd leveringsplatform om IBM-consultants te superchargen met AI

IBM kondigt ook aan een belangrijke uitbreiding van zijn AI-gebaseerde leveringsplatform aan, IBM Consulting Advantage. Het multi-model platform bevat AI agents, applicaties en methodes zoals herhaalbare frameworks die 160.000 IBM consultants in staat kunnen stellen om betere en snellere klantwaarde te leveren tegen lagere kosten.

Als onderdeel van de uitbreiding worden Granite 3.0 taalmodellen het standaardmodel in Consulting Advantage. Door gebruik te maken van de prestaties en efficiëntie van Granite, kan IBM Consulting de return-on-investment voor de generatieve AI-projecten van IBM-klanten maximaliseren.

Een ander belangrijk onderdeel van de uitbreiding is de introductie van IBM Consulting Advantage for Cloud Transformation and Management en IBM Consulting Advantage for Business Operations. Elk van deze producten bevat domeinspecifieke AI-agents, -applicaties en -methoden die zijn verrijkt met IBM's best practices, zodat IBM-consultants klanten kunnen helpen bij het versnellen van cloud- en AI-transformaties in taken, zoals codemodernisering en quality engineering, of bij het transformeren en uitvoeren van activiteiten in verschillende domeinen, zoals financiën, HR en inkoop.

Ga voor meer informatie over Granite en IBM's AI for Business-strategie naar www.ibm.com/granite.

¹ Kostenberekeningen zijn gebaseerd op de prijsstelling van API-kosten per miljoen tokens van IBM watsonx voor open modellen en openAI voor GPT4-modellen (uitgaande van een mix van 80% inout, 20% output) voor proofs-of-concept door klanten.
2 Technisch document van IBM Research: Granite 3.0 Taalmodellen
³ Technisch document IBM Research: Granite 3.0 Taalmodellen
⁴ De kleine tijdmixer: Snelle voorgetrainde modellen voor verbeterde zero/few shot-voorspelling op multivariate tijdreeksen
⁵ Evaluatieresultaten gepubliceerd in Granite Guardian GitHub Repo
⁶ Geplande beschikbaarheid voor Q4 2024
7 Geplande beschikbaarheid voor Q4 2024
8 Geplande beschikbaarheid voor Q1 2025

Gelijkaardige Artikels

De toenmalige IBM baas Thomas Watson Jr. introduceert de System/360 computer in 1964. (Afbeelding: IBM)

8 tot 524 KByte RAM, 8 MByte opslag: IBM's System/360 wordt 60 jaar oud 08-04-2024

De Heron QPU met 133 qubits (Bron: IBM Research/Flickr)

Kwantumcomputers: IBM onthult Condor en Heron quantum CPU's 06-12-2023

Rapidus-oprichters Atsuyoshi Koike en Tetsuro Higashi (Beeldbron: Techspot)

Japanse gieterij Rapidus maakt cutting edge 2 nm nodes met IBM, plannen om tegen 2027 te concurreren met TSMC en Samsung 13-05-2023

Samsung voegt Nvidia, Qualcomm en IBM toe aan zijn 3 nm-klantenlijst, ondanks tegenvallende opbrengsten 26-11-2022

IBM Osprey QPU-structuur (Beeldbron: IBM)

IBM kondigt 433-qubit kwantumprocessor aan, Bosch boort IBM's kwantumcomputers aan in zoektocht naar alternatieve EV-metalen 11-11-2022

Sharge ICEMAG 2 upgrades naar Qi2 d...

Apple iPhone 16 Pro Max verslaat Go...

Editor of the original article: Codrut Nistor - Senior Tech Writer - 6676 articles published on Notebookcheck since 2013

contact me via: @online_digi, online.digital.craft, LinkedIn

Translator: Ninh Ngoc Duy - Editorial Assistant - 521685 articles published on Notebookcheck since 2008

contact me via: Facebook

Please share our article, every link counts!

> Overzichten en testrapporten over laptops en mobieltjes > Nieuws > Nieuws Archief > Nieuws archieven 2024 10 > IBM lanceert Granite 3.0 open-source AI-modellen voor bedrijven

Codrut Nistor, 2024-10-22 (Update: 2024-10-22)