Η τεχνολογία του ChatGPT έφτασε για να ταράξει την αγορά και να μας αφήσει με τα σαγόνια μας να πέφτουν. Αυτή τη φορά, η υπέρβαση πήγε πολύ μακριά! Η τεχνητή νοημοσύνη της OpenAI, μιας αμερικανικής εταιρείας, κλήθηκε να πραγματοποιήσει τη δοκιμή του Το Enem (Εθνικές εξετάσεις γυμνασίου) καθώς και χιλιάδες υποψήφιοι από τη Βραζιλία το δίνουν ετησίως.
Το ChatGPT πραγματοποίησε πενταετείς δοκιμές Enem, από το 2017 έως το 2021, με περισσότερες από χίλιες ερωτήσεις απαντημένες και έλαβε υψηλότερα ποσοστά από τους πραγματικούς υποψηφίους.
δείτε περισσότερα
Η Google αναπτύσσει εργαλείο τεχνητής νοημοσύνης για να βοηθήσει τους δημοσιογράφους…
Το μη ανοιγμένο πρωτότυπο iPhone του 2007 πωλείται για σχεδόν 200.000 $. ξέρω...
Μάθετε για τις αποδόσεις της τεχνητής νοημοσύνης σε έναν από τους πιο αμφισβητούμενους αγώνες στη χώρα.
Η προσδοκία ήταν ότι το chatbot θα έφτανε το 78,9% των υποψηφίων στο τεστ, και αυτό ακριβώς συνέβη: ο μέσος όρος που επιτεύχθηκε ήταν 612,3 σε αντικειμενικά τεστ.
Η Folha de São Paulo υπολόγισε ότι το ChatGPT θα ξεπερνούσε το 98,9% των υποψηφίων ανθρώπων στις ανθρωπιστικές επιστήμες και το 95,3% στις γλώσσες.
Για αυτούς τους τομείς, για παράδειγμα, το ChatGPT μπορεί να χρησιμοποιήσει μόνο υπάρχοντα δεδομένα για να μπορεί να αναλύσει τις ερωτήσεις. Φυσικά, αυτό δεν σημαίνει ότι η τεχνητή νοημοσύνη έχει την κριτική λογική για να λύσει τα ζητήματα, καθώς χρησιμοποιεί μόνο τα ζητήματα που αντιμετωπίστηκαν προηγουμένως.
Στην αίθουσα σύνταξης, το ρομπότ κατάφερε να φτάσει σε βαθμολογία 700, υψηλότερη από το 68% των υποψηφίων που σημείωσαν 613 στον μέσο όρο του τεστ. Το θέμα του 2021 χρησιμοποιήθηκε ως σημείο αναφοράς για το AI και διορθώθηκε από δύο ειδικούς στην εκπαίδευση.
Τα λάθη φάνηκαν στη συντακτική κατασκευή, στην προσθήκη κόμματος, δεν παρουσίαζε δεδομένα, αμάρτησε στο κοινωνικοπολιτισμικό ρεπερτόριο και δεν παρουσίασε την επίλυση για το πρόβλημα που παρουσιάζεται.
Στις μαθηματικές ερωτήσεις, το ποσοστό που επιτεύχθηκε ξεπέρασε μόνο το 27% των υποψηφίων στο δημόσιο πανεπιστήμιο της Βραζιλίας.
Αυτό το μικρότερο ποσοστό ήταν αναμενόμενο, καθώς οι ακριβείς ερωτήσεις ήταν ένα πραγματικό αίνιγμα για το OpenAI chatbot, όπως καθοδηγείται από τα δεδομένα της DeltaFolha.
Το ζήτημα των μαθηματικών προέκυψε από μια πολύ απλή σκέψη, αποτελώντας πραγματικά ένα από τα μεγαλύτερα ερωτήματα σχετικά με τη χρήση της τεχνολογίας.
Όπως δήλωσε ο ερευνητής Ricardo Primi, το ChatGTP δεν ακολουθεί μια γραμμή συλλογισμού και, ως εκ τούτου, δεν μπορεί να ολοκληρώσει τη μαθηματική ερώτηση.
Οι αποτυχίες του ChatGPT είναι επίπεδα στα οποία μόνο οι άνθρωποι μπορούν να φτάσουν με λογικό συλλογισμό και κριτική σκέψη. Σε σύγκριση με τους υποψηφίους, το AI είχε κατά μέσο όρο τη συντριπτική πλειοψηφία.
Λάτρης των ταινιών και των σειρών και ό, τι αφορά τον κινηματογράφο. Ένας ενεργός περίεργος στα δίκτυα, πάντα συνδεδεμένος με πληροφορίες για τον Ιστό.