
Image generated with OpenAI
Γνώμη: Γιατί οι Πράκτορες της Τεχνητής Νοημοσύνης Είναι το Μέλλον της Καθημερινής Τεχνητής Νοημοσύνης
Το 2025 φαίνεται να είναι το έτος της Agentic AI. Η OpenAI, η Microsoft, η Anthropic και άλλες μεγάλες τεχνολογικές εταιρείες έχουν κυκλοφορήσει τα πιο προηγμένα AI μοντέλα τους μέχρι στιγμής, ικανά να εκτελέσουν περίπλοκες εργασίες που δεν ήταν εφικτές μόλις πέρυσι. Αλλά τι ακριβώς είναι οι πράκτορες AI και πόσο από αυτή την τεχνολογία είναι αληθινή έναντι υπερβολής;
Η παρακολούθηση των τάσεων της AI τα τελευταία χρόνια μπορεί να είναι κουραστική. Έχουμε περάσει από τη βασική AI στη δημιουργική AI, στη συλλογιστική AI και τώρα, οι πράκτορες AI κυριαρχούν στη συζήτηση. Τους τελευταίους μήνες, πολλές τεχνολογικές εταιρείες έχουν παρουσιάσει νέους πράκτορες AI και έχουν επισημάνει πώς οι ροές εργασίας που τους συνδέουν γίνονται ολοένα και πιο ελκυστικές.
Τον Ιανουάριο, η OpenAI λανσάρισε τον πρώτο της πράκτορα AI, τον Operator, ικανό να εκτελεί εργασίες αυτόνομα, όπως την περιήγηση στο διαδίκτυο, την κράτηση ενός εστιατορίου ή την εξασφάλιση εισιτηρίων για συναυλία για εσάς, με βάση τις προτιμήσεις και τα κριτήρια σας.
Δύο μήνες αργότερα, η κινεζική εταιρεία startup AI Zhipu κυκλοφόρησε το AutoGLM Rumination, έναν δωρεάν πράκτορα AI που μπορεί να λειτουργεί ανεξάρτητα και να σχεδιάζει ταξίδια για τους χρήστες. Και μόλις λίγες ημέρες πριν, η Microsoft παρουσίασε την “Χρήση Υπολογιστή” για το Copilot Studio, προσθέτοντας περισσότερες αυτόνομες δυνατότητες στους πράκτορες AI, συμπεριλαμβανομένης της δυνατότητας να αναλάβουν τον έλεγχο του επιφάνειας εργασίας του χρήστη.
Αλλά αυτή η τάση δεν αφορά απλά τις εταιρείες που λανσάρουν νέα, δροσερά προϊόντα – είναι για έναν περίπλοκο και εξελισσόμενο τομέα που συνδυάζει διάφορες μορφές Τεχνητής Νοημοσύνης με την ανθρώπινη επαφή. Οι τεχνολογικοί ενθουσιαστές και οι ειδικοί έχουν δείξει ισχυρή αισιοδοξία για την Ατζέντικ Τεχνητή Νοημοσύνη (Agentic AI).
«Η μία τάση που με ενθουσιάζει επίσης είναι ο εργασιακός ρυθμός των AI πρακτόρων», είπε ο ειδικός στην τεχνητή νοημοσύνη και συνιδρυτής της Coursera και της DeepLearning, Andrew Ng, στην συνδιάσκεψη BUILD 2024 της Snowflake τον Νοέμβριο. «Αν ήταν να ρωτήσετε, ποια είναι η σημαντικότερη τεχνολογία Τεχνητής Νοημοσύνης στην οποία πρέπει να δώσετε προσοχή; Θα έλεγα ότι είναι η Ατζέντικ Τεχνητή Νοημοσύνη.»
Λοιπόν, τι ακριβώς είναι οι πράκτορες ΑΙ; Εκτελούν τα καθήκοντά τους τόσο καλά όσο υποστηρίζουν οι ειδικοί; Ακολουθεί μια σύντομη επισκόπηση των πιο ουσιαστικών όψεων αυτής της εμφανιζόμενης τεχνολογίας και των τελευταίων εξελίξεων.
Τι είναι οι πράκτορες ΑΙ;
Όπως έχουν δείξει εταιρείες όπως η OpenAI και η Microsoft, οι πράκτορες AI είναι τεχνολογίες ικανές να εκτελούν πολύπλοκα καθήκοντα με το να συνδυάζουν αυτόνομα διάφορες εφαρμογές και λογισμικά.
Ουσιαστικά, είναι «παραδοσιακά» AI chatbots – αλλά πιο προηγμένα, ικανά να εκτελέσουν εργασίες πέρα από αυτό που έχουμε συνηθίσει τα τελευταία δύο χρόνια. Αυτές περιλαμβάνουν τον προγραμματισμό, την περιήγηση στο διαδίκτυο, την απομνημόνευση των ενδιαφερόντων σας, και ακόμα και την πραγματοποίηση των αγορών σας χωρίς βήμα-προς-βήμα οδηγίες, καθώς βρίσκουν λύσεις μόνα τους.
Google Cloud ορίζει τους AI παράγοντες ως «συστήματα λογισμικού που χρησιμοποιούν την AI για να επιδιώκουν στόχους και να ολοκληρώνουν εργασίες εκ μέρους των χρηστών».
Αυτό που κάνει αυτά τα μοντέλα AI πραγματικά ξεχωριστά είναι οι προηγμένες δυνατότητες σκέψης τους, οι οποίες τους επιτρέπουν να επεξεργάζονται πολλούς τύπους πληροφοριών – ήχο, κείμενο, βίντεο, κώδικα και εικόνες – ταυτόχρονα. Μπορούν να κατανοούν περίπλοκες καταστάσεις όπως θα έκανε ένας άνθρωπος, να παίρνουν δράση και να αλληλεπιδρούν με λογισμικά και πλατφόρμες.
Πολλές τεχνολογικές εταιρείες τώρα προωθούν τα μοντέλα AI τους σε αυτό το επόμενο επίπεδο.
Μόλις πριν από λίγες μέρες, το OpenAI ανακοίνωσε ότι τα AI μοντέλα του o3 και o4-mini μπορούν να «σκέφτονται» με εικόνες και να τις χειρίζονται – για παράδειγμα, να τις περικόπτουν ή να τις μετασχηματίζουν. Την ίδια στιγμή, η νέα λειτουργία «Χρήση Υπολογιστή» της Microsoft επιτρέπει στους πράκτορες AI της να αναγνωρίζουν γραφικά περιβάλλοντα χρήστη.
«Αν ένα άτομο μπορεί να χρησιμοποιήσει την εφαρμογή, τότε μπορεί και ο πράκτορας», είπε ο Charles Lamanna, Αντιπρόεδρος Εταιρικής Διαχείρισης, Επιχειρηματικός & Βιομηχανικός Συνεργάτης στη Microsoft, στην ανακοίνωση.
Το Επόμενο Επίπεδο: Τεχνολογία AI με Δυνατότητα Πρακτορικής Δράσης
Ενώ πολλές τεχνολογικές εταιρείες αναπτύσσουν υπερέξυπνα chatbots βασισμένα στην AI, η agentic AI πάει ένα βήμα παραπέρα. Αυτή η τεχνολογία επικεντρώνεται στη δημιουργία συστημάτων στα οποία πολλαπλοί από αυτούς τους πράκτορες AI μπορούν να αλληλεπιδρούν και να εκτελούν διάφορες εργασίες για να παρέχουν πιο ακριβή και πλήρη αποτελέσματα.
Κατά την ομιλία της με θέμα «Η Δύναμη των Πρακτόρων AI» σε ένα πρόσφατο event Tech Talk που παρακολούθησα, το οποίο διοργανώθηκε από την eDreams, η ειδικός στην AI Patricia Gutierrez Faxas εξήγησε ότι αυτά τα συστήματα μπορούν να υιοθετήσουν διάφορες δομές. Τα multi-agent συστήματα μπορούν να διαλύσουν πολύπλοκες εργασίες σε απλούστερες, να τις αναθέσουν σε εξειδικευμένους πράκτορες και να διαμορφώσουν διάφορους τύπους δικτύων.
Ένας πράκτορας Τεχνητής Νοημοσύνης μπορεί να αναλάβει τον ρόλο του «Επόπτη», αναθέτοντας μικρότερα καθήκοντα σε άλλους εξειδικευμένους πράκτορες, ή πολλοί πράκτορες μπορούν να εργάζονται ταυτόχρονα σε ξεχωριστές εργασίες και να συντονίζονται για να παράσχουν το τελικό αποτέλεσμα. Ορισμένα από τα οφέλη αυτών των συστημάτων περιλαμβάνουν βελτιωμένη ακρίβεια, μεγαλύτερη ιδιωτικότητα και μειωμένα σφάλματα.
Ο Andrew Ng συμφωνεί με αυτήν την προσέγγιση. Κατά τη διάρκεια της ομιλίας του στο BUILD 2024, τόνισε τη σημασία των ροών εργασίας της Αποκλειστικής Τεχνητής Νοημοσύνης για την επεξεργασία περίπλοκων εργασιών με πολύ καλύτερα αποτελέσματα. Το άλμα στην απόδοση από μοντέλα όπως το GPT-3.5 στο GPT-4 – και τα ισχυρότερα αποτελέσματά τους στα benchmarks κωδικοποίησης – οφείλεται κυρίως στις ροές εργασίας και τη λογική της Αποκλειστικής Τεχνητής Νοημοσύνης.
Πώς θα επηρεάσουν τη ζωή μας οι AI πράκτορες;
Οι τεχνολογικές εταιρείες υιοθετούν διάφορες προσεγγίσεις στην Agentic AI. Η OpenAI έχει επικεντρωθεί σε ιδέες για καθημερινούς χρήστες. Κατά την εκκίνηση του Operator, η ομάδα εξήγησε σε ένα βίντεο ότι ένας άνθρωπος θα μπορούσε απλά να σκεφτεί ένα πιάτο που θα ήθελε να ετοιμάσει, να ζητήσει από το ChatGPT να βρει την καλύτερη συνταγή, και ακόμη και να τον βοηθήσει να αγοράσει τα απαραίτητα συστατικά από ένα online supermarket.
Το μοντέλο AI θα μπορούσε να κάνει ερωτήσεις επαναληπτικά και να κάνει παύση πριν εκτελέσει κρίσιμες εργασίες, όπως η ολοκλήρωση αγοράς χρησιμοποιώντας την πιστωτική κάρτα του χρήστη. Οι χρήστες μπορούν να θέσουν όρια δαπανών ή να απαιτήσουν από τον βοηθό να ζητήσει επιβεβαίωση πριν κάνει οποιαδήποτε αγορά.
Οι δυνατότητες για τον τρόπο με τον οποίο οι κανονικοί άνθρωποι μπορούν να χρησιμοποιήσουν πράκτορες AI φαίνονται ατελείωτες, αλλά τα πιο δημοφιλή σενάρια χρήσης μέχρι στιγμής περιλαμβάνουν την ενεργοποίηση ως πρακτορεία ταξιδιών, προσωπικούς ψωνίστες και διοικητικούς βοηθούς – τέλος πάντων, ποιος δεν θα ήθελε μια προσωποποιημένη τεχνολογία που στέλνει emails, θυμάται σημαντικές επέτειοι και φροντίζει για τους φόρους;
Η Microsoft έχει ακολουθήσει μια πιο εταιρική προσέγγιση. Η εταιρεία έχει δείξει πώς τα διαφημιστικά πρακτορεία μπορούν να χρησιμοποιήσουν πράκτορες AI για να αυτοματοποιήσουν τη συλλογή δεδομένων της αγοράς και να δημιουργήσουν αναλύσεις βασισμένες σε ευρήματα, ή πώς μεγάλες επιχειρήσεις μπορούν να τους χρησιμοποιήσουν για την επεξεργασία τιμολογίων εντός των συστημάτων τους.
Ωστόσο, ενώ όλες αυτές οι περιπτώσεις χρήσης φαίνονται επαναστατικές, οι ειδικοί συμφωνούν ότι υπάρχει ακόμα μακρύς δρόμος μπροστά. Οι περισσότεροι άνθρωποι δεν μπορούν ακόμα να χρησιμοποιήσουν πράκτορες AI για να βελτιώσουν την καθημερινή τους ζωή, καθώς πολλές από αυτές τις λειτουργίες, όπως ο Operator, είναι διαθέσιμες μόνο για τους Pro χρήστες, μια συνδρομή που κοστίζει $200 το μήνα.
Άρα, τελικά, οι πράκτορες AI ανταποκρίνονται στην υπερβολή;
Πολλά μέσα ενημέρωσης προβλέπουν μια νέα επανάσταση της Τεχνητής Νοημοσύνης (AI) υπό την ηγεσία της Agentic AI. Υπάρχει σίγουρα πολύς ντόρος στον κλάδο – και η πραγματικότητα ενδέχεται να μην απέχει πολύ. Μια πρόσφατη έκθεση που δημοσίευσε η IBM αποκάλυψε ότι πολλοί προγραμματιστές εξερευνούν ενεργά και αναπτύσσουν αυτήν την τεχνολογία.
“Η IBM και η Morning Consult διεξήγαγαν έρευνα σε 1.000 προγραμματιστές που κατασκευάζουν εφαρμογές AI για επιχειρήσεις και το 99% από αυτούς δήλωσε ότι εξερευνούν ή αναπτύσσουν πράκτορες AI”, εξήγησε η διδάκτωρ Maryam Ashoori, Διευθύντρια Προϊόντων στην IBM watsonx.ai. “Έτσι ναι, η απάντηση είναι ότι το 2025 θα είναι το έτος του πράκτορα.”
Ωστόσο, οι ειδικοί σημειώνουν ότι υπάρχουν πολλαπλές ερμηνείες για το τι πραγματικά είναι οι πράκτορες της Τεχνητής Νοημοσύνης και πώς θα έπρεπε να λειτουργούν. Ως αποτέλεσμα, η πρόοδος και η απόδοση των τρέχοντων πρακτόρων της Τεχνητής Νοημοσύνης εξαρτώνται συχνά από την οπτική γωνία και τα πρότυπα του ατόμου που αξιολογεί την τεχνολογία.
Αυτό που είναι βέβαιο είναι ότι πολλοί ειδικοί και υπεύθυνοι λήψης αποφάσεων πιστεύουν βαθιά σε αυτήν την τεχνολογία και επενδύουν σημαντικά στην ανάπτυξή της. Μια πρόσφατη έρευνα αποκάλυψε ότι το 84% των ηγετών του IT εμπιστεύονται τους πράκτορες της Τεχνητής Νοημοσύνης όσο τους ανθρώπους, και η OpenAI προβλέπει περίπου $125 δισεκατομμύρια εσόδων έως το 2029.
Παρόλο που η τεχνολογία Agentic AI δεν έχει ακόμη αναπτυχθεί πλήρως και η υιοθέτησή της δεν είναι τόσο ευρεία όσο αυτή των chatbots, κυρίως λόγω του υψηλού της κόστους, είναι σαφές ότι ο εκπληκτικός οπτιμισμός και ενθουσιασμός γύρω από αυτή την τάση είναι αρκετά ισχυροί για να προκαλέσουν σημαντικές αλλαγές στους προσεχείς μήνες.
Αφήστε ένα σχόλιο
Ακύρωση