Image by Matheus Bertelli, from Pexels

Το AI της DeepSeek Μαθαίνει Να Σκέφτεται Μόνο του

Χρόνος ανάγνωσης: 2 λεπτό

Τελευταία ενημέρωση: Apr 8, 2025

Γράφτηκε από Kiara Fabbri Δημοσιογράφος Πολυμέσων
Μεταφρασμένο από Ομάδα Τοπικής Προσαρμογής και Μετάφρασης Υπηρεσίες Τοπικής Προσαρμογής και Μετάφρασης

Η κινεζική επιχειρηματική εκκίνηση DeepSeek, σε συνεργασία με το Πανεπιστήμιο Tsinghua, λέει ότι έχει αναπτύξει μια πιο έξυπνη μέθοδο για να βοηθήσει τα μοντέλα της τεχνητής νοημοσύνης να σκέφτονται καλύτερα και πιο γρήγορα, χωρίς την ανάγκη για τεράστιους υπολογιστές ή ακριβούς πόρους.

Βιάζεστε; Ορίστε τα γρήγορα γεγονότα:

Η DeepSeek δημιούργησε έναν αυτοβελτιώνοντα AI χρησιμοποιώντας τον αυτορυθμιζόμενο κριτικό συντονισμό (Self-Principled Critique Tuning – SPCT).
Το SPCT διδάσκει την AI να αξιολογεί το δικό της έργο με τη χρήση αυτοπαραγόμενων κανόνων.
Η μέθοδος αυξάνει την απόδοση χωρίς την ανάγκη για τεράστια υπολογιστική ισχύ.

Η ανακάλυψη προέρχεται από μια νέα τεχνική που ονομάζεται Self-Principled Critique Tuning (SPCT). Το SPCT διαφέρει από το απλό κάνουμε τα μοντέλα AI μεγαλύτερα για να βελτιώσουμε την απόδοση – το SPCT δεν απαιτεί πολλή ενέργεια και υπολογιστική ισχύ για να διδάξει την AI να κρίνει την δική της δουλειά χρησιμοποιώντας ένα σύνολο κανόνων που έχει δημιουργήσει η ίδια.

Ο τρόπος που λειτουργεί είναι μέσω ενός ενσωματωμένου «δικαστή» που επαληθεύει ότι η απάντηση της AI τηρεί τόσο τους εσωτερικούς κανόνες λογικής της, όσο και φαίνεται κατάλληλη για ανθρώπινη εξόδο. Όταν η AI παρέχει μια σταθερή απάντηση, λαμβάνει θετική ανατροφοδότηση, που τη βοηθά να βελτιώσει την ικανότητά της να απαντά σε παρόμοιες ερωτήσεις σε μελλοντικές περιπτώσεις.

Το DeepSeek υλοποιεί αυτήν την μέθοδο ως μέρος του συστήματός του DeepSeek-GRM, που σημαίνει Generative Reward Modeling. Το GRM λειτουργεί διαφορετικά από τις παραδοσιακές μεθόδους, επειδή εκτελεί παράλληλους ελέγχους για να βελτιώσει τόσο την ακρίβεια όσο και τη συνέπεια.

«Προτείνουμε τον Αυτο-Αρχορισμένο Κριτικό Συντονισμό (Self-Principled Critique Tuning – SPCT) για να ενισχύσουμε τις συμπεριφορές δημιουργίας κλιμακούμενων ανταμοιβών», έγραψαν οι ερευνητές στην εργασία τους. «Το SPCT επιτρέπει στο [μοντέλο] να προσαρμόζει ενεργά αρχές και κριτικές βάσει του εισερχόμενου ερωτήματος και των απαντήσεων, οδηγώντας σε καλύτερες ανταμοιβές αποτελέσματος.»

Με αυτό το σύστημα, η DeepSeek ισχυρίζεται ότι η AI της μπορεί τώρα να επιδόσει καλύτερα από τους ανταγωνιστές όπως το Gemini της Google, το Llama της Meta και το GPT-4o της OpenAI, ιδιαίτερα όταν πρόκειται για σύνθετες εργασίες όπως το συλλογισμό ή τη λήψη αποφάσεων, όπως σημείωσε το Euronews.

Σημαντικό είναι ότι η DeepSeek δηλώνει ότι σχεδιάζει να κυκλοφορήσει αυτά τα νέα εργαλεία ως λογισμικό ανοιχτού κώδικα, αν και δεν έχει μοιραστεί ακόμη κάποια ημερομηνία κυκλοφορίας.

Το AI της DeepSeek Μαθαίνει Να Σκέφτεται Μόνο του

Είναι χαρά μας που σας αρέσει η δουλειά μας!

Αφήστε ένα σχόλιο