
Η πολυτροπική μάθηση ήταν πάντα μια πρόκληση Τεχνητή νοημοσύνη, καθώς διαφορετικοί τύποι δεδομένων απαιτούν διαφορετικές προσεγγίσεις για αποτελεσματική επεξεργασία – κάτι που μερικοί μηχανικής εκμάθησης απέχουν ακόμη πολύ από το να πραγματοποιηθούν.
Ωστόσο, ερευνητές από το Κινεζικό Πανεπιστήμιο του Χονγκ Κονγκ και το εργαστήριο AI της Σαγκάης κατέληξαν σε μια καινοτόμο λύση: "Meta-Transformer", ένα ενοποιημένο πλαίσιο AI που μπορεί να χειριστεί πολλαπλές μεθόδους δεδομένων χρησιμοποιώντας το ίδιο σύνολο Παράμετροι. Κατανοήστε τις λεπτομέρειες παρακάτω!
δείτε περισσότερα
AI και φόρτος εργασίας: όφελος ή πρόκληση για επαγγελματίες;
Ο δημιουργός του ChatGPT βάζει τέλος στο εργαλείο ανίχνευσης κειμένων που έγιναν…
Ο ανθρώπινος εγκέφαλος αποτελεί έμπνευση για αυτή τη νέα προσέγγιση. Ο εγκέφαλός μας επεξεργάζεται ταυτόχρονα πληροφορίες από πολλαπλές αισθητηριακές εισροές, όπως οπτικά, ακουστικά και απτικά σήματα, και η κατανόηση μιας πηγής μπορεί να βοηθήσει στην κατανόηση μιας άλλης.
Ωστόσο, η αναπαραγωγή αυτής της ικανότητας στον τομέα της τεχνητής νοημοσύνης ήταν πρόκληση λόγω του κενού τρόπου λειτουργίας στη βαθιά μάθηση.
(Εικόνα: Thinkhubstudio/iStock/αναπαραγωγή)
Οι τρόποι δεδομένων έχουν διακριτά χαρακτηριστικά. Οι εικόνες έχουν χωρικές πληροφορίες και πλεονασμό πληροφοριών σε συμπιεσμένα pixel. Τα σημειακά σύννεφα είναι δύσκολο να περιγραφούν λόγω της αραιής κατανομής τους στον τρισδιάστατο χώρο.
Τα ακουστικά φασματογράμματα είναι μη στάσιμα, χρονικά μεταβαλλόμενα μοτίβα δεδομένων. Τα δεδομένα βίντεο, με τη σειρά τους, περιλαμβάνουν μια σειρά πλαισίων εικόνων, τα οποία επιτρέπουν την καταγραφή χωρικών πληροφοριών και χρονικής δυναμικής.
Μέχρι τώρα, οι προσεγγίσεις για την αντιμετώπιση διαφορετικών τρόπων περιελάμβαναν τη δημιουργία χωριστών δικτύων για κάθε τύπο δεδομένων, με αποτέλεσμα πολλή δουλειά για τη λεπτομερή ρύθμιση των μοντέλων ξεχωριστά. Ωστόσο, Κινέζοι ερευνητές έχουν προτείνει έναν νέο τρόπο αντιμετώπισης αυτής της πολυπλοκότητας.
Ο Meta-Transformer αποτελείται από τρία βασικά στοιχεία: έναν ειδικό τροπολογιών για τον προσδιορισμό δεδομένων, ένα κοινόχρηστος κωδικοποιητής τροπικότητας για εξαγωγή αναπαραστάσεων μεταξύ των τρόπων λειτουργίας και των κεφαλών συγκεκριμένων εργασιών για εργασίες «κατάντη».
Αυτό το πλαίσιο επιτρέπει τη δημιουργία κοινών ακολουθιών διακριτικών από πολυτροπικά δεδομένα και την εξαγωγή αναπαραστάσεων χρησιμοποιώντας έναν κωδικοποιητή με παγωμένες παραμέτρους. Η απλή προσέγγιση του Meta-Transformer εκπαιδεύει αποτελεσματικά τις αναπαραστάσεις τρόπων λειτουργίας και γενικής χρήσης.
Τα αποτελέσματα των πειραμάτων Meta-Transformer ήταν εντυπωσιακά. Το πλαίσιο πέτυχε εξαιρετική απόδοση σε πολλαπλά σύνολα δεδομένων που εκτείνονται σε 12 διαφορετικές μεθόδους.
Αυτή η καινοτόμος προσέγγιση υπόσχεται μια νέα κατεύθυνση στην ανάπτυξη ενός αγνωστικιστικού πλαισίου για τροπικότητα, η οποία ενοποιεί όλους τους τύπους δεδομένων και βελτιώνει σημαντικά την ικανότητα κατανόηση πολυτροπικό.
Με το Meta-Transformer, η πολυτροπική αναζήτηση πρόκειται να κάνει ένα μεγάλο βήμα προς τα εμπρός, προσφέροντας σημαντικές προόδους στην τεχνητή νοημοσύνη και τη μηχανική μάθηση.
Η ικανότητα επεξεργασίας πολλαπλών τρόπων δεδομένων με ένα ενιαίο, ενοποιημένο πλαίσιο αντιπροσωπεύει ένα σημαντικό ορόσημο στο ταξίδι προς πιο ισχυρό και αποτελεσματικό AI.