Den teknologiske udvikling har haft en betydelig indvirkning på forskellige brancher, og oversætterbranchen er ingen undtagelse. Med fremkomsten af AI-drevne sprogmodeller, såsom ChatGPT, er der opstået muligheder for, at man i virksomhederne selv i et vist omfang kan automatisere og optimere oversættelsesprocessen. Men selvom disse teknologier kan være nyttige, skal man være opmærksom på de udfordringer, som computergenereret materiale kan medføre.
For at forstå, hvilke mangler ChatGPT har, og dermed hvilke udfordringer man står overfor i processen, er det nødvendigt at forstå, hvor værktøjet får sin viden fra.
Hvor har ChatGPT sin viden fra?
Det datasæt, som bruges til at træne ChatGPT, er enormt. Datasættet er baseret på GPT-3-arkitekturen (generative pre-trained transformer 3), der er trænet på et datasæt på mere end 45 TB og genererer resultater, der er ”fortrænet” – dvs. tekstoutputtet er baseret på alle de data GPT-3-arkitekturen indtager.
Den sproglige kvalitet af ChatGPT-output
Den store datamængde gør det muligt for ChatGPT at lære mønstre og relationer mellem ord og sætninger i naturligt sprog. Det betyder også, at ChatGPT ikke nødvendigvis kender grammatikreglerne, f.eks. ordbøjninger, køn og sammensatte navneord, og kan navigere i dem. Derudover er ChatGPT også trænet gennem et samtale-datasæt bestående af mere end 160.000 dialoger mellem to menneskelige deltagere. Det giver værktøjet mulighed for at lære, hvordan man genererer svar, der er personlige og relevante for den specifikke kontekst af samtalen. Det kan betyde, at den tekst I får genereret er baseret på talesprog og ikke skriftsprog. Dermed risikerer I, at der opstår forståelsesproblemer mellem jer og jeres modtagere, eller at jeres materiale ikke fremstår tilstrækkeligt sagligt og professionelt, f.eks. hvis I får udarbejdet en aftale eller kontrakt.
Derfor anbefaler vi altid, at I får læst en grundig korrektur på den ChatGPT-genererede tekst, inden I bruger den, så I kan få rettet både sproglige og indholdsmæssige fejl. Bruger I ukritisk tekst genereret af ChatGPT, risikerer I, at materialet indeholder grammatiske fejl, som kan få materialet til at fremstå uprofessionelt. Hvis I ikke selv har en kvalificeret korrekturlæser internt, kan I kontakte jeres eksterne leverandør af sprogløsninger og få deres professionelle korrekturlæsere til at gennemlæse jeres materiale.
Når data er forkert
Udover disse datasæt (og mange flere) er ChatGPT også trænet ved hjælp af en stor mængde ustrukturerede data, der er fundet ved at trawle internettet, herunder diverse hjemmesider, bøger og andre tekstkilder. ChatGPT er ikke kildekritisk, hvilket betyder, at hvis der er fejlinformation i datasættet, vil ChatGPT altså gentage disse fejl. ChatGPT kopierer og indsætter ikke blot informationerne fra datasættet, men forudsiger også en række ord, den forventer kommer næste gang baseret på de milliarder af datapunkter, den har. Det betyder altså, at ChatGPT kan generere misinformation på baggrund af informationerne fra internettet. Skaberne af ChatGPT har selv udtalt, at værktøjet kan producere forkert information, selvom det er noget, de arbejder på at rette op på.
Det vil altså sige, at ChatGPT udover sproglige mangler også er begrænset i forhold til kvaliteten af indholdet. Værktøjet har mangler i forhold til at kunne aflæse og fange kulturelle nuancer i sprog. Det kan være en udfordring, når det drejer sig om sprognuancer eller faste udtryk, som kræver at man kender kulturen indgående for at kunne lave anvende dem korrekt i den rette kontekst. Hvis det tekstoutput, man får, desuden er baseret på fejlagtige informationer, der er hentet et vilkårligt sted på internettet, risikerer man at videregive urigtige oplysninger eller måske oven i købet at pådrage sig ansvar, fordi man er kommet til at hævde, at virksomheden eller virksomhedens produkter kan noget, som faktisk ikke er tilfældet. Disse eventuelle unøjagtigheder, fejlfortolkninger og misinformationer kan i sidste ende betyde, at jeres virksomhed mister kunder eller risikerer at pådrage jer et økonomisk ansvar.
ChatGPT ved ikke alt
Får man ChatGPT til at udforme sit materiale, der omhandler specifikke fagområdet, kan man ende i problemer. ChatGPT har nemlig ikke altid adgang til specifik viden, og det kan være et stort problem, når man arbejder med fagspecifikt materiale, hvor terminologien og præcise betydninger er afgørende. Ydermere kan forkerte data på internettet resulterer i, at ChatGPT videregiver forkerte informationer, som i sidste ende kan have store konsekvenser for jeres købere eller jeres virksomhed, hvis disse fejl ikke bliver opdaget og rettet i tide.
ChatGPT som oversættelsesværktøj
Som de fleste andre andre værktøjer har ChatGPT sine udfordringer. Det kan bruges til at oversætte tekstinput fra ét sprog til et andet, som man kender det fra andre maskinoversættelsesværktøjer. Her er det endnu engang vigtigt at få korrekturlæst oversættelsen, da resultatet er baseret på genkendelsesmønstre og ikke nødvendigvis samme kontekst som kildeteksten. Dermed kan der opstå problemer i forhold til terminologi og forståelse. Desuden kan teksten blive oversat til et sprog, man ikke selv har indsigt i og derfor ikke kan vurdere kvaliteten af – måske kender man ikke engang alfabetet på det pågældende sprog. Derfor anbefaler vi, at man får disse oversættelser verificeret og korrekturlæst (sprogligt og indholdsmæssigt) af professionelle korrekturlæsere på det pågældende sprog. Kontakt jeres eksterne leverandør af sprogløsninger. De kan helt sikkert hjælpe jer.
Kvalitetsbegrænsninger, tab af nuancer, manglende fagspecifik viden, fejlinformation og fejloversættelser er områder, hvor ChatGPT ikke lever op til den menneskelige kvalitet. Derfor anbefaler vi altid, at I får tjekket jeres tekster igennem sprogligt og indholdsmæssigt af professionelle korrekturlæsere og sprogrevisorer, som sikrer jer den højeste kvalitet. Kontakt jeres sprogpartner for at finde den løsning, der matcher jeres behov. I er også velkomne til at kontakte vores projektlederteam på pm@wordpilots.dk for at få en dialog omkring mulige løsninger.
