ChatGPT udfører Enem: det overgik 80% af kandidaterne, men mislykkedes i matematik

Teknologien af ChatGPT ankom for at ryste markedet og efterlade os med faldende kæber. Denne gang gik overvindelsen for vidt! Den kunstige intelligens fra OpenAI, et amerikansk firma, blev tilkaldt til at udføre testen af Enem (National High School Exam) samt tusindvis af brasilianske kandidater tager den årligt.

ChatGPT udførte femårige Enem-tests, fra 2017 til 2021, med mere end tusinde spørgsmål besvaret og opnået højere procenter end rigtige kandidater.

se mere

Google udvikler AI-værktøj til at hjælpe journalister i...

Uåbnet original 2007 iPhone sælges for næsten $200.000; ved godt...

ChatGPT udfører Enem-testen

Lær om udbyttet af kunstig intelligens i en af de mest omstridte racer i landet.

Sprog, menneske og skrift

Forventningen var, at chatbotten ville nå op på 78,9 % af kandidaterne i testen, og det var præcis, hvad der skete: Gennemsnittet opnået var 612,3 i objektive test.

Folha de São Paulo anslog, at ChatGPT ville overgå 98,9% af menneskelige kandidater inden for humanvidenskab og 95,3% på sprog.

For disse områder kan ChatGPT eksempelvis kun bruge eksisterende data til at kunne analysere spørgsmålene. Det betyder naturligvis ikke, at kunstig intelligens har den kritiske sans til at løse problemerne, da den kun gør brug af de tidligere behandlede problemstillinger.

I nyhedsredaktionen formåede robotten at nå en score på 700, højere end 68% af kandidaterne, der scorede 613 på testgennemsnittet. 2021-temaet blev brugt som benchmark for AI og blev rettet af to uddannelseseksperter.

Fejlene blev set i den syntaktiske konstruktion, ved tilføjelse af kommaer præsenterede den ikke data, den syndede i det sociokulturelle repertoire og den præsenterede ikke løsningen for det præsenterede problem.

Matematik

I matematiske spørgsmål oversteg den nåede procentdel kun 27% af kandidaterne til det brasilianske offentlige universitet.

Denne mindre procentdel var forventet, da de nøjagtige spørgsmål var en reel gåde for OpenAI chatbot, som guidet af DeltaFolha-dataene.

Spørgsmålet om matematik opstod ud fra en meget simpel tanke, der virkelig er et af de største spørgsmål vedrørende brugen af teknologi.

Som forsker Ricardo Primi udtalte, følger ChatGTP ikke et ræsonnement og kan derfor ikke fuldføre det matematiske spørgsmål.

ChatGPT-fejl er niveauer, som kun mennesker kan nå med logisk ræsonnement og kritisk tænkning. Sammenlignet med kandidaterne var AI i gennemsnit langt størstedelen.

Elsker af film og serier og alt hvad der involverer biograf. En aktiv nysgerrig på netværkene, altid forbundet med information om nettet.

Platform tilbyder gratis Administrativ assistent kursus

on Aug 03, 2023

ChatGPT udfører Enem: det overgik 80% af kandidaterne, men mislykkedes i matematik

ChatGPT udfører Enem-testen

7. klasses religiøse undervisningsaktiviteter

Federal Institute åbner 2000 pladser i gratis kurser

Platform tilbyder gratis Administrativ assistent kursus