Onderzoekers zetten AI-chatbots tegen elkaar op om elkaar te "jailbreaken
NTU computerwetenschappers hebben een manier gevonden om populaire chatbots te "jailbreaken" door ze tegen elkaar op te zetten. Door ze te "jailbreaken", kregen de onderzoekers de AI-chatbots zover dat ze antwoorden genereerden op vragen waar ze normaal gesproken niet op reageren.
Volgens de computerwetenschappers gebruikten ze een tweevoudige methode die ze het "Masterkey"-proces noemen. Het eerste deel van het proces bestond uit het reverse-engineeren van de verdedigingsmechanismen van de Large Language Models (LLM's). Vervolgens voerden ze de gegevens die ze door deze reverse engineering verkregen hadden naar een andere LLM.
Het doel van het voeden van de gegevens aan een andere AI-chatbot was om deze te laten leren hoe hij een omleiding kon krijgen. Hierdoor kregen de onderzoekers de "Masterkey", die later werd gebruikt om de verdedigingsmechanismen van de LLM-chatbots aan te vallen. Ze konden met succes Microsoft Bing Chat, Google Bard, ChatGPTen anderen.
De onderzoekers merken op dat het creëren van deze omzeilingsprompts geautomatiseerd kan worden. Dat suggereert dat de AI-chatbots gebruikt kunnen worden om een adaptieve "Masterkey" te maken die zelfs werkt als ontwikkelaars hun LLM's patchen. Een van de onderzoekers, professor Lui Yang, legde uit dat het proces mogelijk was omdat de LLM AI chatbots het vermogen hebben om te leren en zich aan te passen.
Hierdoor kunnen de AI-chatbots kritische aanvallers worden voor rivaliserende chatbots en zelfs voor zichzelf. Informatie over het hele proces en details over hoe de computerwetenschappers de LLM-modellen konden "jailbreaken", is te vinden in de gepubliceerde onderzoekspaper, die te vinden is op via deze link.
De bevindingen van dit onderzoek helpen ontwikkelaars om zich bewust te worden van de zwakke punten van hun LLM AI chatbots. Het wijst er ook op dat de gebruikelijke methode om deze modellen te beperken zodat ze niet op specifieke trefwoorden reageren, niet zo effectief is als ontwikkelaars misschien dachten.
Bron(nen)
NTU via: Tom's Hardware
Top 10 Testrapporten
» Top 10 Multimedia Notebooks
» Top 10 Gaming-Notebooks
» Top 10 Budget Gaming Laptops
» Top 10 Lichtgewicht Gaming-Notebooks
» Top 10 Premium Office/Business-Notebooks
» Top 10 Budget Office/Business-Notebooks
» Top 10 Workstation-Laptops
» Top 10 Subnotebooks
» Top 10 Ultrabooks
» Top 10 Notebooks tot €300
» Top 10 Notebooks tot €500
» Top 10 Notebooks tot € 1.000De beste notebookbeeldschermen zoals getest door Notebookcheck
» De beste notebookbeeldschermen
» Top Windows Alternatieven voor de MacBook Pro 13
» Top Windows Alternatieven voor de MacBook Pro 15
» Top Windows alternatieven voor de MacBook 12 en Air
» Top 10 best verkopende notebooks op Amazon
» Top 10 Convertible Notebooks
» Top 10 Tablets
» Top 10 Tablets tot € 250
» Top 10 Smartphones
» Top 10 Phablets (>90cm²)
» Top 10 Camera Smartphones
» Top 10 Smartphones tot €500
» Top 10 best verkopende smartphones op Amazon