OpenAI præsenterer GPT-3: Sprogmodel kan lære af få eksempler
OpenAI har offentliggjort GPT-3, en revolutionerende sprogmodel med 175 milliarder parametre, der kan udføre komplekse sprogopgaver med minimal træning.
Den amerikanske AI-forskningsorganisation OpenAI har taget et markant skridt fremad inden for kunstig intelligens med lanceringen af GPT-3, en sprogmodel der er ti gange større end nogen tidligere model af sin art.
Det særligt bemærkelsesværdige ved GPT-3 er dens evne til at lære nye opgaver fra blot få eksempler – en egenskab forskerne kalder “few-shot learning”. Hvor traditionelle AI-systemer kræver tusindvis af eksempler for at blive trænet til specifikke opgaver, kan GPT-3 tilpasse sig nye udfordringer med minimal vejledning.
Imponerende resultater på tværs af opgaver
Ifølge forskningsartiklen, der blev offentliggjort den 28. maj 2020, præsterer GPT-3 stærkt på en lang række sprogopgaver, herunder oversættelse, spørgsmål-svar og tekstforståelse. Modellen kan endda udføre opgaver der kræver logisk ræsonnement, såsom at løse trecifrede regnestykker eller bruge nye ord korrekt i sætninger.
Det særlige ved GPT-3 er, at den ikke kræver nogen form for finjustering eller opdatering af sine parametre. I stedet interagerer brugeren udelukkende med modellen gennem tekst, hvor opgaver og eksempler specificeres direkte i prompten.
Udfordringer og etiske overvejelser
Forskerne påpeger dog også begrænsninger. På visse datasæt kæmper GPT-3 stadig med at levere tilfredsstillende resultater, og der er metodiske udfordringer forbundet med at træne på store mængder data fra internettet.
En særlig bekymrende observation er, at GPT-3 kan generere nyhedsartikler, som menneskelige evaluatorer har svært ved at skelne fra artikler skrevet af rigtige journalister. Dette rejser vigtige spørgsmål om modellens potentielle samfundsmæssige konsekvenser.
Bag GPT-3 står et team på 31 forskere fra OpenAI, ledet af blandt andre Tom Brown, Ilya Sutskever og Dario Amodei. Modellen repræsenterer et betydeligt fremskridt i bestræbelserne på at skabe AI-systemer, der kan forstå og generere menneskelig sprog på et niveau, der nærmer sig menneskelig præstation.
