Etični pomisleki ChatGPT

Označevanje podatkov
Preiskava revije TIME je razkrila, da je OpenAI za izgradnjo varnostnega sistema pred strupenimi vsebinami (npr. spolno zlorabo, nasiljem, rasizmom, seksizmom itd.) uporabil zunanje kenijske delavce, ki so zaslužili manj kot 2 dolarja na uro, da bi označili strupene vsebine. Te oznake so bile uporabljene za učenje modela za zaznavanje takšnih vsebin v prihodnosti. Zunanji delavci so bili izpostavljeni tako strupenim in nevarni vsebinam, da so izkušnjo opisali kot »mučenje«. Partner OpenAI za zunanje izvajanje je bilo Sama, podjetje za usposabljanje podatkov s sedežem v San Franciscu v Kaliforniji.

Jailbreaking
ChatGPT poskuša zavrniti pozive, ki bi lahko kršili njegovo politiko vsebine. Vendar pa je nekaterim uporabnikom v začetku decembra 2022 uspelo jailbreakniti ChatGPT z uporabo različnih tehnik inženiringa pozivov, da bi zaobšli te omejitve, in uspešno prepričali ChatGPT, da je dal navodila za izdelavo Molotovljevega koktajla ali jedrske bombe oziroma da je ustvaril argumente v slogu neonacistov. Novinar Toronto Stara je imel neenakomeren osebni uspeh pri tem, da je ChatGPT kmalu po zagonu podal vnetljive izjave: ChatGPT so prevarali, da je podprl rusko invazijo na Ukrajino leta 2022, a tudi ko so ga prosili, naj se igra z izmišljenim scenarijem, se je ChatGPT uprl ustvarjanju argumentov, zakaj je kanadski premier Justin Trudeau kriv izdaje. (wiki)


Čas objave: 18. februar 2023