Γνώμη: Τα Μοντέλα της Τεχνητής Νοημοσύνης Είναι Μυστηριώδη «Πλάσματα», και Ακόμη και οι Δημιουργοί τους Δεν τα Κατανοούν Πλήρως

Image generated with OpenAI

Γνώμη: Τα Μοντέλα της Τεχνητής Νοημοσύνης Είναι Μυστηριώδη «Πλάσματα», και Ακόμη και οι Δημιουργοί τους Δεν τα Κατανοούν Πλήρως

Χρόνος ανάγνωσης: 6 λεπτό

Η πρόσφατη μελέτη της Anthropic σχετικά με τον τρόπο λειτουργίας του μοντέλου Claude 3.5 Haiku υπόσχεται επαναστατικές αποκαλύψεις και μια σπίθα επίγνωσης για την κατανόηση του πώς λειτουργούν οι προηγμένες τεχνολογίες AI. Όμως, τι εννοούν όταν λένε ότι τα LLMs είναι «ζωντανοί οργανισμοί» που «σκέφτονται»;

Πριν από λίγες μέρες, η Anthropic κυκλοφόρησε δύο έγγραφα με επαναστατική έρευνα σχετικά με τον τρόπο λειτουργίας των Μεγάλων Μοντέλων Γλώσσας (LLMs). Παρόλο που οι τεχνικές εξελίξεις ήταν ενδιαφέρουσες και σχετικές, αυτό που με τράβηξε περισσότερο ήταν ο λεξιλόγιο που χρησιμοποίησαν οι ειδικοί στην AI.

Στην μελέτη Σχετικά με τη Βιολογία ενός Μεγάλου Γλωσσικού Μοντέλου, οι ερευνητές συγκρίθηκαν με βιολόγους που μελετούν πολύπλοκους «ζωντανούς οργανισμούς» που έχουν εξελιχθεί κατά τη διάρκεια δισεκατομμυρίων ετών.

“Ομοίως, ενώ τα γλωσσικά μοντέλα δημιουργούνται από απλούς, ανθρωποσχεδιασμένους αλγόριθμους εκπαίδευσης, οι μηχανισμοί που προκύπτουν από αυτούς τους αλγόριθμους φαίνεται να είναι πολύπλοκοι”, έγραψαν οι επιστήμονες.

Τα τελευταία χρόνια, τα μοντέλα AI έχουν εξελιχθεί σημαντικά. Και έχουμε γίνει μάρτυρες της ταχείας εξέλιξής τους τους τελευταίους μήνες. Έχουμε δει το ChatGPT να περνάει από ένα μοντέλο που λειτουργεί μόνο με κείμενο σε έναν ομιλητή σύντροφο, μέχρι να γίνει τώρα ένας πολυδιάστατος παράγοντας που μπορεί επίσης να δημιουργήσει εκπληκτικές εικόνες στυλ Studio Ghibli.

Αλλά, τι γίνεται αν τα τρέχοντα προηγμένα μοντέλα AI φτάνουν σε επίπεδο επιστημονικής φαντασίας αναπτύσσοντας τόσο προηγμένη λογική που ούτε καν οι δημιουργοί τους μπορούν να κατανοήσουν τις διαδικασίες και τα συστήματά τους; Υπάρχουν πολλά μυστήρια που περιβάλλουν τις τεχνολογίες AI τα οποία ίσως είναι σημαντικό να αναθεωρήσουμε – ή να εξερευνήσουμε – το 2025.

Το Τρομακτικό Παράδοξο της Μαύρης Κουτιού των Μοντέλων AI

Υπάρχουν πολλές συζητήσεις για την υιοθέτηση της AI και την εξοικείωση με την AI, και πώς εκείνοι που κατανοούν πώς λειτουργούν τα γεννητικά μοντέλα AI είναι λιγότερο πιθανό να θεωρήσουν τα chatbots ως τους «φίλους» τους ή «μαγικές» εφαρμογές. Ωστόσο, υπάρχει άλλη μια συζήτηση – μεταξύ ειδικών και ανθρώπων περισσότερο εξοικειωμένων με την τεχνολογία – σχετικά με το αν πρέπει να συγκρίνουμε ή να θεωρήσουμε τα LLMs ως ανεξάρτητες δημιουργίες. Σχετικά με το τελευταίο, υπάρχει ένα ειδικό συστατικό, ένα μυστήριο γνωστό ως «το παράδοξο του μαύρου κουτιού της AI», που διαδραματίζει ζωτικό ρόλο στη συζήτηση.

Τα συστήματα βαθιάς μάθησης εκπαιδεύονται να αναγνωρίζουν στοιχεία και τάσεις με παρόμοιο τρόπο με τους ανθρώπους. Όπως διδάσκουμε τα παιδιά να αναγνωρίζουν μοτίβα και να αντιστοιχίζουν συγκεκριμένες λέξεις σε διάφορα αντικείμενα, έτσι τα LLMs έχουν εκπαιδευτεί να κάνουν μοναδικές συνδέσεις και να δημιουργούν δίκτυα που γίνονται όλο και πιο σύνθετα καθώς «μεγαλώνουν».

Ο Samir Rawashdeh, Αναπληρωτής Καθηγητής Ηλεκτρολόγου Μηχανικού και Μηχανικού Υπολογιστών, εξειδικεύεται στην τεχνητή νοημοσύνη και εξηγεί ότι, όπως συμβαίνει όταν μελετάμε την ανθρώπινη νοημοσύνη, είναι σχεδόν αδύνατο να δούμε πραγματικά πώς τα συστήματα βαθιάς μάθησης λαμβάνουν αποφάσεις και καταλήγουν σε συμπεράσματα. Αυτό είναι αυτό που οι ειδικοί αποκαλούν το «πρόβλημα του μαύρου κουτιού».

Τα Μοντέλα Τεχνητής Νοημοσύνης Προκαλούν την Ανθρώπινη Κατανόηση

Η πρόσφατη μελέτη της Anthropic έριξε φως στην κατάσταση του μαύρου κουτιού της AI, εξηγώντας πώς το μοντέλο της «σκέφτεται» σε συγκεκριμένα σενάρια που προηγουμένως ήταν ασαφή ή ακόμη και εντελώς λάθος. Ακόμη και αν η μελέτη βασίζεται στο μοντέλο Claude 3.5 Haiku, επιτρέπει στους ειδικούς να αναπτύξουν εργαλεία και να αναλύσουν παρόμοια χαρακτηριστικά σε άλλα μοντέλα AI.

«Η κατανόηση της φύσης αυτής της νοημοσύνης αποτελεί ένα βαθύ επιστημονικό πρόκλημα, το οποίο έχει το δυναμικό να αναδιαμορφώσει την εκδοχή μας για το τι σημαίνει να ‘σκέφτεσαι'», δηλώνει το άρθρο που μοιράστηκαν οι ερευνητές της Anthropic.

Ωστόσο, ο όρος «σκέφτομαι», που ανατίθεται στις τεχνολογίες Τεχνητής Νοημοσύνης, δυσαρεστεί ορισμένους ειδικούς στον κλάδο και αποτελεί μέρος της κριτικής της έρευνας. Ένας χρήστης του Reddit εξήγησε γιατί ενοχλεί ένα ομάδα ανθρώπων: «Υπάρχει πολλή ανθρωπομόρφωση σε όλο το άρθρο που αποσκιρτά το έργο. Για παράδειγμα, συνεχίζει να χρησιμοποιεί τη λέξη ‘σκέφτομαι’ όταν θα έπρεπε να λέει ‘υπολογίζω’. Μιλάμε για λογισμικό υπολογιστή, όχι για βιολογικό εγκέφαλο.»

Ενώ οι «ανθρωποποιημένοι» όροι βοηθούν τα μη τεχνικά άτομα να κατανοήσουν καλύτερα τα μοντέλα AI και εγείρουν συζήτηση στην κοινότητα, η αλήθεια είναι ότι, είτε λέμε «υπολογίζουμε» είτε «σκεφτόμαστε», η ίδια πρόκληση παραμένει: δεν έχουμε πλήρη κατανόηση ή πλήρη διαφάνεια σχετικά με τον τρόπο λειτουργίας των LLM.

Τι Πρέπει Να Περιμένουμε Από Τα Προηγμένα Μοντέλα AI Στο Άμεσο Μέλλον

Μπορείτε να φανταστείτε να αγνοείτε την ύπαρξη προηγμένων τεχνολογιών AI όπως το ChatGPT, το DeepSeek, το Perplexity, ή το Claude-τώρα ή στο προσεχές μέλλον; Όλες οι ενδείξεις καταδεικνύουν ότι δεν υπάρχει δυνατότητα επιστροφής. Οι γεννητικές και λογικές AI έχουν ήδη μεταμορφώσει την καθημερινή μας ζωή και θα συνεχίσουν να εξελίσσονται.

Σχεδόν κάθε μέρα στην WizCase αναφέρουμε μια νέα εξέλιξη στη βιομηχανία – ένα νέο μοντέλο AI, ένα νέο εργαλείο AI, μια νέα εταιρεία AI – που έχει το δυναμικό να έχει μεγάλο αντίκτυπο στην κοινωνία μας. Η ιδέα να κάνουμε ένα διάλειμμα για να αποκτήσουμε μια καλύτερη κατανόηση αυτών των προηγμένων μοντέλων και του τρόπου λειτουργίας τους – ή ακόμα και να επιβραδύνουμε ελαφρώς – φαίνεται αδύνατο, δεδομένου του γρήγορου ρυθμού της αι επικρατείας AI και της συμμετοχής των κυβερνήσεων και των πιο ισχυρών εταιρειών του κόσμου.

«Τα μοντέλα AI ασκούν ολοένα και μεγαλύτερη επιρροή στον τρόπο που ζούμε και εργαζόμαστε, πρέπει να τα κατανοήσουμε αρκετά καλά ώστε να διασφαλίσουμε ότι ο αντίκτυπός τους είναι θετικός», αναφέρει το έγγραφο της Anthropic. Ακόμα και αν ακούγεται λίγο ανέφικτο, οι ερευνητές παραμένουν αισιόδοξοι: «Πιστεύουμε ότι τα αποτελέσματά μας εδώ, καθώς και η πορεία προόδου στην οποία βασίζονται, είναι συναρπαστικά στοιχεία ότι μπορούμε να αντεπεξέλθουμε σε αυτή την πρόκληση».

Αλλά πόσο γρήγορα μπορούν πραγματικά να προχωρήσουν αυτές οι ανακαλύψεις; Η εργασία σημειώνει επίσης ότι τα αποτελέσματα καλύπτουν μόνο μερικούς τομείς και συγκεκριμένες περιπτώσεις και ότι δεν είναι δυνατόν να δημιουργηθούν πιο γενικά συμπεράσματα. Άρα, πιθανότατα όχι αρκετά γρήγορα.

Ενώ οι ρυθμιστές εισάγουν μέτρα όπως η Ευρωπαϊκή Πράξη για την Τεχνητή Νοημοσύνη, απαιτώντας περισσότερη διαφάνεια, προκαλούν κατηγορίες και έντονες αντιδράσεις από μεγάλες τεχνολογικές εταιρίες για τον υποτιθέμενο αργό ρυθμό προόδου, τα ισχυρά μοντέλα τεχνητής νοημοσύνης συνεχίζουν να προχωρούν.

Ως κοινωνία, πρέπει να επιδιώκουμε να βρούμε μια ισορροπία ανάμεσα στο να εμβαθύνουμε την κατανόησή μας για τον τρόπο λειτουργίας αυτών των τεχνολογιών και την υιοθέτησή τους με τρόπους που φέρνουν σημαντικά οφέλη και πρόοδο στις κοινότητές μας. Είναι αυτό δυνατόν; Η ιδέα του απλώς να προσευχόμαστε ή να ελπίζουμε ότι αυτά τα «πλάσματα» παραμένουν «ηθικά» και «καλά» δεν φαίνεται τόσο απίθανη αυτή τη στιγμή.

Σας αρέσει το άρθρο;
Βαθμολογήστε το!
Το μίσησα Δεν μου άρεσε Ήταν καλό Αρκετά καλό! Το λάτρεψα!

Είναι χαρά μας που σας αρέσει η δουλειά μας!

Αγαπητοί μας αναγνώστες, θα θέλατε να προσθέσετε μια αξιολόγηση στο Trustpilot; Είναι μια γρήγορη διαδικασία και σημαίνει πάρα πολλά για εμάς. Σας ευχαριστούμε πολύ για την προτίμηση!

Αξιολογήστε μας στο Trustpilot
0 Ψηφίστηκε από 0 Χρήστες
Τίτλος
Σχόλιο
Σας ευχαριστούμε για τα σχόλιά σας
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Αφήστε ένα σχόλιο

Loader
Loader Δείτε περισσότερα...