Notebookcheck Logo

Whisper-Medusa is aiOla's nieuwe open-source AI-model voor spraakherkenning. Het claimt 50% sneller te zijn dan OpenAI's Whisper

aiOla is een in Israël gevestigd bedrijf dat AI-gestuurde oplossingen gebruikt voor het digitaliseren van papieren workflows. (Afbeeldingsbron: aiOla)
aiOla is een in Israël gevestigd bedrijf dat AI-gestuurde oplossingen gebruikt voor het digitaliseren van papieren workflows. (Afbeeldingsbron: aiOla)
aiOla heeft Whisper-Medusa gelanceerd, een open-source AI-model ontworpen om automatische spraakherkenning te verbeteren. Whisper-Medusa combineert OpenAI's Whisper met aiOla's technologie en claimt 50% sneller te werken dan Whisper zelf. Dit model ondersteunt meer dan 100 talen en zet ongestructureerde spraakgegevens om in bruikbare inzichten, wat veelbelovend is voor de toekomst in sectoren zoals de luchtvaart, logistiek en gezondheidszorg.

aiOla is een in 2019 in Israël gevestigd bedrijf dat gespecialiseerd is in AI-gestuurde oplossingen voor het digitaliseren van papieren workflows. Het bedrijf introduceerde onlangs Whisper-Medusa, een open-source AI-model dat een combinatie is van OpenAI's Whisper en aiOla's technologie. Het beweert meer dan 50% sneller te werken met behoud van een hoge nauwkeurigheid. Deze snelheid wordt bereikt door een unieke tokenvoorspellingsmethode, waarbij tien tokens per keer worden voorspeld in plaats van één, zoals te zien is in OpenAIwhisper.

Whisper-Medusa is ontwikkeld met behulp van zwakke supervisie. Dit proces omvat het gebruik van Whisper om audio datasets te transcriberen, die vervolgens dienen als labels om de tokenvoorspellingsmodules van Medusa te trainen.

Whisper-Medusa zou een grote aanwinst kunnen zijn voor bedrijven die in hun dagelijkse werkzaamheden nog steeds afhankelijk zijn van papieren workflows. De technologie van aiOla kan via het backendsysteem 'aiOla Jargonic' eerstelijnswerkers in verschillende bedrijfstakken helpen. In de voedingsmiddelenindustrie heeft aiOla bijvoorbeeld de kwaliteitscontrole gestroomlijnd door handmatige controlelijsten om te zetten in digitale workflows. Het bedrijf zegt dat het hele proces "net zo eenvoudig is als het uploaden van een foto of bestand van uw bestaande processen".

Whisper-Medusa ondersteunt meer dan 100 talen en verschillende accenten en zou ook nuttig kunnen zijn in sectoren zoals de luchtvaart, voedselproductie, logistiek en gezondheidszorg. Door ongestructureerde spraakgegevens om te zetten in bruikbare inzichten, kunnen bedrijven hun kosten verlagen en de toewijzing van middelen verbeteren.

Geïnteresseerden kunnen de open-source bestanden vinden op Hugging Face en GitHub.

whisper-Medusa van aiOla claimt 50% sneller te zijn dan Whisper van OpenAI. (Afbeeldingsbron: aiOla)
whisper-Medusa van aiOla claimt 50% sneller te zijn dan Whisper van OpenAI. (Afbeeldingsbron: aiOla)

Bron(nen)

Please share our article, every link counts!
> Overzichten en testrapporten over laptops en mobieltjes > Nieuws > Nieuws Archief > Nieuws archieven 2024 08 > Whisper-Medusa is aiOla's nieuwe open-source AI-model voor spraakherkenning. Het claimt 50% sneller te zijn dan OpenAI's Whisper
Anubhav Sharma, 2024-08- 4 (Update: 2024-08- 4)