Photo by John Schnobrich on Unsplash

Η Alibaba Κυκλοφορεί το Νέο Μοντέλο AI Qwen και Υποστηρίζει Ότι Υπερτερεί του DeepSeek-V3

Χρόνος ανάγνωσης: 2 λεπτό

Τελευταία ενημέρωση: Jan 31, 2025

Γράφτηκε από Andrea Miliani Ειδικός σε τεχνολογικές ειδήσεις
Μεταφρασμένο από Ομάδα Τοπικής Προσαρμογής και Μετάφρασης Υπηρεσίες Τοπικής Προσαρμογής και Μετάφρασης

Ο κινεζικός γίγαντας Alibaba κυκλοφόρησε την τελευταία έκδοση του κορυφαίου μοντέλου AI του, Qwen, αυτή την Τετάρτη. Η εταιρεία υποστηρίζει ότι μπορεί να λειτουργήσει καλύτερα από το δημοφιλές DeepSeek-V3.

Βιάζεστε; Εδώ είναι τα γρήγορα γεγονότα!

Η Alibaba κυκλοφόρησε το τελευταίο της μοντέλο λογικής Qwen 2.5-Max αυτή την Τετάρτη.
Ο Κινέζικος γίγαντας ισχυρίζεται ότι υπερτερεί δημοφιλών μοντέλων όπως το DeepSeek-V3, το GPT-4o και το Llama-3.1-405B.
Η εταιρεία ξεκίνησε επίσης την Qwen2.5-VL αυτή την εβδομάδα, ένα μοντέλο AI ικανό να επεξεργάζεται εικόνες και να λειτουργεί ως πράκτορας AI χρησιμοποιώντας υπολογιστές και κινητά για την εκτέλεση εργασιών.

Σύμφωνα με το Reuters, η Alibaba κυκλοφόρησε το νέο Qwen 2.5-Max, όπως έχει ονομάσει το νέο μοντέλο λογικής, ακριβώς κατά τη διάρκεια των διακοπών του Νέου Έτους του Φεγγαριού στην Κίνα, για να ενταχθεί στις τεράστιες αναπτύξεις AI των τελευταίων ημερών και να προσθέσει εγχώριο ανταγωνισμό.

Τη Δευτέρα, η DeepSeek κατέκτησε την πρώτη θέση στο App Store της Apple στις Ηνωμένες Πολιτείες, ξεπερνώντας το ChatGPT, ανησυχώντας άλλες εταιρείες στη βιομηχανία της AI και συναγερμένοι επενδυτές – οι μετοχές της Nvidia έπεσαν κατά 17% μέσα σε μόλις μία ημέρα.

Τώρα, η Alibaba ανακοίνωσε τις τελευταίες εκδόσεις του μοντέλου της Qwen – κυκλοφόρησε 100 ανοιχτού κώδικα AI μοντέλα για τη σουίτα Qwen τον Σεπτέμβριο του προηγούμενου έτους – υποσχόμενη καλύτερα αποτελέσματα από δημοφιλή πρωτοποριακά μοντέλα.

«Το Qwen 2.5-Max υπερτερεί (…) σχεδόν σε όλους τους τομείς του GPT-4o, του DeepSeek-V3 και του Llama-3.1-405B,» έγραψε η εταιρεία στον επίσημο λογαριασμό της στο WeChat.

Το νέο μοντέλο λογικής Qwen 2.5-Max είναι διαθέσιμο μέσω του cloud της Alibaba και οι χρήστες μπορούν επίσης να δοκιμάσουν το μοντέλο στην σελίδα συνομιλίας του.

«Αναπτύσσουμε το Qwen2.5-Max, ένα μεγάλης κλίμακας μοντέλο MoE που έχει προεκπαιδευτεί σε περισσότερα από 20 τρισεκατομμύρια tokens και περαιτέρω μετα-εκπαιδεύτηκε με επιλεγμένες μεθοδολογίες Supervised Fine-Tuning (SFT) και Reinforcement Learning from Human Feedback (RLHF)», έγραψε η Ομάδα Qwen στο Github.

Ο κινεζικός γίγαντας κυκλοφόρησε επίσης την Δευτέρα το Qwen2.5-VL, μια σειρά από multimodal AI μοντέλα που μπορούν επίσης να επεξεργάζονται εικόνες και να έχουν πρόσβαση σε κινητά και υπολογιστές για να εκτελούν εργασίες. Η OpenAI ανακοίνωσε μια παρόμοια λειτουργία, το Operator, επιτρέποντας στο ChatGPT να εκτελεί εργασίες αυτόνομα, ελέγχοντας τον υπολογιστή του χρήστη.

Σύμφωνα με την ομάδα της Alibaba, όλα τα μοντέλα Qwen υπερτερούν σε απόδοση από παρόμοιες εκδόσεις της OpenAI, Microsoft, Google, Meta, και DeepSeek.

Η Alibaba Κυκλοφορεί το Νέο Μοντέλο AI Qwen και Υποστηρίζει Ότι Υπερτερεί του DeepSeek-V3

Είναι χαρά μας που σας αρέσει η δουλειά μας!

Αφήστε ένα σχόλιο