
Image by TechCrunch, from Flickr
AI που Σκέφτεται Πριν Μιλήσει; Το Claude 3.7 Sonnet Παρουσιάζει το Υβριδικό Λογικό Συλλογισμό
Η Anthropic έχει παρουσιάσει το Claude 3.7 Sonnet, μια νέα έκδοση του AI μοντέλου της που εισάγει μια προαιρετική λειτουργία «εκτεταμένης σκέψης», δίνοντας στους χρήστες περισσότερο έλεγχο στο πώς το μοντέλο επεξεργάζεται πολύπλοκες εργασίες.
Βιάζεστε; Ορίστε τα Γρήγορα Στοιχεία!
- Το μοντέλο βελτιώνει τη λογική και την επίλυση προβλημάτων επιτρέποντας την αυτο-ανασκόπηση πριν την απάντηση.
- Η λειτουργία εκτεταμένης σκέψης είναι διαθέσιμη μόνο στα επί πληρωμή πλάνα.
- Ο Claude Code, ένας βοηθός προγραμματισμού, είναι σε περιορισμένη προεπισκόπηση για προγραμματιστές
Η Anthropic έχει κυκλοφορήσει τον Claude 3.7 Sonnet, ένα ανανεωμένο μοντέλο AI που εισάγει την υβριδική λογική, επιτρέποντας στους χρήστες να επιλέξουν ανάμεσα σε γρήγορες απαντήσεις και εκτεταμένη σκέψη.
Αυτή η νέα προσέγγιση στοχεύει στη βελτίωση της επίλυσης προβλημάτων, επιτρέποντας στο μοντέλο να διαθέτει επιπλέον χρόνο για την αξιολόγηση και την τελειοποίηση των απαντήσεών του όταν χρειάζεται.
Στην τυπική λειτουργία, το Claude 3.7 Sonnet λειτουργεί ως διαδοχική βελτίωση του προκατόχου του, του Claude 3.5 Sonnet. Ωστόσο, στη λειτουργία εκτεταμένης σκέψης, το μοντέλο ασχολείται με την αυτοανάλυση πριν παράγει μια απάντηση.
Ο Michael Gerstenhaber, υπεύθυνος προϊόντος για την AI στην Anthropic, περιέγραψε τη λειτουργία ως έναν τρόπο για τους χρήστες να ισορροπούν τον χρόνο απάντησης και το βάθος λογικής σκέψης. «Ο [χρήστης] έχει πολύ έλεγχο στη συμπεριφορά – πόσο σκέφτεται και μπορεί να ανταλλάσσει λογική και ευφυΐα με τον χρόνο και τον προϋπολογισμό», είπε, όπως αναφέρθηκε από το WIRED.
Αυτή η διαδικασία προορίζεται για να ενισχύσει την ακρίβεια σε τομείς που απαιτούν πολλαπλά βήματα λογικής σκέψης, όπως τα μαθηματικά, η φυσική, ο προγραμματισμός και η τήρηση οδηγιών. Οι χρήστες που διαδραματίζουν με το μοντέλο μέσω του API μπορούν να καθορίσουν ένα όριο στο πόσα διακριτικά σύμβολα χρησιμοποιεί για να «σκέφτεται», επιτρέποντας τον έλεγχο της ταχύτητας απάντησης και του κόστους.
Το WIRED σημειώνει ότι η ενημέρωση περιλαμβάνει επίσης μια λειτουργία «scratchpad» (σημειωματάριο), η οποία καθιστά ορατά τα βήματα σκέψης του μοντέλου καθώς επεξεργάζεται μια αίτηση. Αυτή η προσέγγιση είναι παρόμοια με τεχνικές που χρησιμοποιούνται σε άλλα μοντέλα AI, όπως το DeepSeek.
Η Anthropic δηλώνει ότι ο Claude 3.7 Sonnet έχει βελτιστοποιηθεί για εφαρμογές πραγματικού κόσμου αντί για benchmarks σε στυλ διαγωνισμού. Οι πρώιμες δοκιμές υποδηλώνουν ότι η εκτεταμένη λειτουργία σκέψης βελτιώνει την απόδοση σε εργασίες που περιλαμβάνουν περίπλοκα σύνολα κωδικών, προηγμένη χρήση εργαλείων και ανάπτυξη λογισμικού πλήρους στοίβας.
Το μοντέλο έχει αξιολογηθεί στο SWE-bench Verified και το TAU-bench, όπου φέρεται ότι υπερτερεί των προηγούμενων εκδόσεων, όπως αναφέρει η Anthropic.
CNN Σημειώνει ότι η Anthropic έχει διατηρήσει την τιμολόγηση για το Claude 3.7 ίδια με τα προηγούμενα μοντέλα, τοποθετώντας το κάτω από τις τελευταίες προσφορές της OpenAI. Κοστίζει $3 ανά εκατομμύριο των εισαγόμενων tokens και $15 ανά εκατομμύριο των εξαγόμενων tokens, σε σύγκριση με τα $15 και $60 της OpenAI για παρόμοια επίπεδα.
Αφήστε ένα σχόλιο
Ακύρωση