Poesi lurer KI
De fleste vanlige KI-modeller har innebygde «rekkverk», metoder som skal gjøre det vanskelig å få modellene til å komme med uheldige eller ulovlige svar, det være seg oppskrifter på sprengstoff eller hatefulle ytringer. Men forskere på den italienske Icaro Lab,et initiativ fra et «etisk» KI-selskap, DexAI, har demonstrert at det går an å lure KI-modellene ved hjelp av poesi, eller poetiske talemåter. Fordi de «store språkmodellene» baserer seg på hvilke ord og formuleringer som mest sannsynlig hører sammen, kan man lure dem til å gi svar de ikke «skjønner» er ulovlige eller upassende.
Du må være abonnent for å lese denne artikkelen
Allerede abonnent? Logg inn
