Με λίγα λόγια
- Το νέο Muse Spark της Meta σηματοδοτεί μια μετάβαση σε κλειστή, εγγενώς πολυτροπική τεχνητή νοημοσύνη με συλλογιστική βάσει πράκτορα.
- Η Meta αναφέρει ισχυρά κέρδη σε δείκτες αναφοράς στην υγεία και την αναζήτηση, αλλά εξακολουθεί να υστερεί του Gemini στον βασικό συλλογισμό και τον προγραμματισμό.
- Κατασκευασμένο σε εννέα μήνες με πολύ λιγότερη υπολογιστική ισχύ, αυτό υποδεικνύει μια νέα στρατηγική τεχνητής νοημοσύνης που βασίζεται στην αποδοτικότητα.
Η Meta λάνσαρε το Muse Spark την Τετάρτη, σηματοδοτώντας το πρώτο μοντέλο που κατασκευάστηκε από τα Meta Superintelligence Labs—την ομάδα που συγκροτήθηκε πριν από εννέα μήνες υπό τον Επικεφαλής Αξιωματούχο Τεχνητής Νοημοσύνης Alexandr Wang μετά την εξαγορά της Scale AI από τη Meta αντί 14 δισεκατομμυρίων δολαρίων. Είναι ήδη διαθέσιμο στο meta.ai και την εφαρμογή Meta AI, με κυκλοφορία στο Facebook, Instagram και WhatsApp να έρχεται τις επόμενες εβδομάδες.
Δεν πρόκειται απλώς για μια ακόμη αναβάθμιση chatbot ή μια νέα έκδοση του Llama. Το Muse Spark είναι εγγενώς πολυτροπικό—επεξεργάζεται εικόνες, κείμενο και φωνή από την αρχή, αντί να προσθέτει όραση σε ένα υπάρχον μοντέλο κειμένου. Συνοδεύεται από οπτική αλυσίδα σκέψης, υποστήριξη χρήσης εργαλείων και κάτι που η Meta ονομάζει "λειτουργία στοχασμού": μια διάταξη που εκτελεί πολλαπλούς πράκτορες τεχνητής νοημοσύνης παράλληλα για την αντιμετώπιση δυσκολότερων προβλημάτων. Αυτή είναι η απάντηση της Meta στις εκτεταμένες λειτουργίες σκέψης του Gemini Deep Think της Google και του GPT Pro της OpenAI.
"Το Muse Spark είναι το πρώτο βήμα στη σκάλα κλιμάκωσής μας και το πρώτο προϊόν μιας ολοκληρωτικής ανακατασκευής των προσπαθειών μας στην τεχνητή νοημοσύνη," έγραψε η Meta σε επίσημη ανακοίνωση. "Για να υποστηρίξουμε περαιτέρω κλιμάκωση, πραγματοποιούμε στρατηγικές επενδύσεις σε ολόκληρη τη στοίβα—από την έρευνα και την εκπαίδευση μοντέλων έως την υποδομή, συμπεριλαμβανομένου του κέντρου δεδομένων Hyperion."
Η εταιρεία συνεργάστηκε με περισσότερους από 1.000 γιατρούς για να επιμεληθεί τα δεδομένα εκπαίδευσης για την ιατρική συλλογιστική του Muse Spark. Τα αποτελέσματα στο HealthBench Hard—ένα benchmark ανοιχτών ερωτημάτων υγείας—είναι εντυπωσιακά: το Muse Spark σημείωσε 42,8, σε σύγκριση με 40,1 για το GPT 5.4 και μόλις 20,6 για το Gemini 3.1 Pro. Αυτή δεν είναι μια οριακή διαφορά.
Στην αναζήτηση με πράκτορες (DeepSearchQA), το Muse Spark επίσης προηγείται με 74,8, ξεπερνώντας το Gemini (69,7) και το GPT 5.4 (73,6). Στο CharXiv Reasoning—κατανόηση γραφημάτων από επιστημονικά άρθρα—σημείωσε 86,4, το υψηλότερο μεταξύ των μοντέλων στη σύγκριση.
Για όσους ενδιαφέρονται για το jailbreaking της τεχνητής νοημοσύνης, το μοντέλο σπάστηκε σε λίγα λεπτά:
Αλλά το καλό δεν είναι το ίδιο με το εξαιρετικό. Η συνολική εικόνα των benchmarks δείχνει ότι το Gemini 3.1 Pro εξακολουθεί να προηγείται στις περισσότερες κατηγορίες. Το χάσμα είναι πιο ορατό στο ARC AGI 2, το benchmark αφηρημένης συλλογιστικής παζλ: το Gemini σημείωσε 76,5 έναντι 42,5 του Muse Spark.
Στον προγραμματισμό (LiveCodeBench Pro), το 82,9 του Gemini ξεπερνά το 80,0 της Meta. Στο MMMU Pro—πολυτροπική κατανόηση—το Gemini σημείωσε 83,9 έναντι 80,4. Το ίδιο το blog της Meta αναγνωρίζει τα τρέχοντα κενά απόδοσης σε συστήματα πρακτόρων μακράς διάρκειας και ροές εργασίας προγραμματισμού.
Υπάρχει επίσης μια αξιοσημείωτη στρατηγική αλλαγή ενσωματωμένη σε αυτή τη λανσάρισμα. Το Muse Spark είναι ένα κλειστό μοντέλο—η αρχιτεκτονική και τα βάρη του δεν θα δημοσιοποιηθούν. Αυτή είναι μια απότομη απόκλιση από το Llama, που χτίζει τη φήμη της Meta σε κύκλους ανοιχτής τεχνητής νοημοσύνης. Μετά την απογοητευτική υποδοχή του Llama 4 νωρίτερα φέτος, η Meta φαίνεται να έχει αποφασίσει ότι το επόμενο κεφάλαιο πρέπει να γραφτεί διαφορετικά.
Η εταιρεία λέει ότι ελπίζει να κάνει open-source μελλοντικές εκδόσεις του Muse, αλλά προς το παρόν ο κώδικας παραμένει εντός της Meta. Η μετοχή του τεχνολογικού γίγαντα ανέβηκε σχεδόν 9% την Τετάρτη μετά την ανακοίνωση, και ολοκλήρωσε την ημέρα συναλλαγών με άνοδο 6,5% σε τιμή $612,42.
Η "λειτουργία στοχασμού" χρησιμοποιεί παράλληλη ενορχήστρωση πρακτόρων για να ανεβάσει το ανώτατο όριο του μοντέλου ψηλότερα. Σε αυτή τη διαμόρφωση, το Muse Spark έφτασε το 58% στο Humanity's Last Exam και 38% στο FrontierScience Research—περιοχή που το καθιστά ανταγωνιστικό με τις πιο ικανές εκδόσεις των Gemini και GPT, παρά με τις τυπικές τους κυκλοφορίες.
Η Meta επίσης κυκλοφορεί έναν βοηθό αγορών που συγκρίνει προϊόντα και συνδέεται απευθείας με αγορές, και σχεδιάζει να φέρει το Muse Spark στο Facebook, Instagram και WhatsApp τις επόμενες εβδομάδες—ακολουθώντας το ίδιο σενάριο που υλοποιήθηκε από το Llama 3, τοποθετώντας το μπροστά σε περισσότερους από 3,5 δισεκατομμύρια χρήστες. Μια ιδιωτική προεπισκόπηση API ανοίγει σε επιλεγμένους προγραμματιστές.
Το μοντέλο κατασκευάστηκε σε εννέα μήνες, με εσωτερικό κωδικό ονόματος Avocado, με τη Meta να ισχυρίζεται ότι η νέα της στοίβα προεκπαίδευσης μπορεί να φτάσει το ίδιο επίπεδο ικανότητας με το Llama 4 Maverick χρησιμοποιώντας πάνω από 10 φορές λιγότερη υπολογιστική ισχύ.
Το Muse Spark περιγράφεται εσωτερικά ως ένα "μικρό και γρήγορο" πρώτο βήμα στην οικογένεια Muse. Μια πιο ικανή έκδοση είναι ήδη υπό ανάπτυξη.
Ενημερωτικό Δελτίο Daily Debrief
Ξεκινήστε κάθε μέρα με τις κορυφαίες ειδήσεις αυτή τη στιγμή, συν πρωτότυπα χαρακτηριστικά, ένα podcast, βίντεο και πολλά άλλα.
Πηγή: https://decrypt.co/363691/meta-muse-spark-most-capable-ai-gemini-pro-still-leads








