TECHin

Llama 4: Η νέα ναυαρχίδα μοντέλων τεχνητής νοημοσύνης (AI) της Meta


Η Meta παρουσίασε μια νέα σειρά μοντέλων τεχνητής νοημοσύνης (AI), τη Llama 4, μέλος της οικογένειας Llama - και μάλιστα... Σάββατο.

Η νέα συλλογή περιλαμβάνει τέσσερα μοντέλα: Llama 4 Scout, Llama 4 Maverick και Llama 4 Behemoth. Σύμφωνα με τη Meta, εκπαιδεύτηκαν όλα με «τεράστιους όγκους μη επισημασμένων δεδομένων κειμένου, εικόνας και βίντεο», προκειμένου να αποκτήσουν «ευρεία οπτική κατανόηση».

Η επιτυχία των ανοιχτών μοντέλων της κινεζικής AI DeepSeek — τα οποία επιτυγχάνουν επιδόσεις ισάξιες ή και ανώτερες των προηγούμενων Llama της Meta — φέρεται να επιτάχυνε την ανάπτυξη της σειράς Llama. Η Meta, λέγεται, κινητοποιήθηκε άμεσα, για να καταλάβει πώς η DeepSeek κατάφερε να μειώσει το κόστος εκτέλεσης και ανάπτυξης μοντέλων όπως τα R1 και V3.

Τα Scout και Maverick είναι διαθέσιμα ανοιχτά μέσω του Llama.com και συνεργατών της Meta. Το Behemoth παραμένει ακόμη υπό εκπαίδευση. Η Meta ανακοίνωσε ότι ο ψηφιακός της βοηθός, Meta AI, που είναι ενσωματωμένος σε εφαρμογές όπως WhatsApp, Messenger και Instagram, έχει ήδη ενημερωθεί ώστε να χρησιμοποιεί το Llama 4 σε 40 χώρες — αν και οι πολυτροπικές δυνατότητες (κείμενο + εικόνα + ήχος) περιορίζονται προς το παρόν στις ΗΠΑ και μόνο στα αγγλικά.

Ωστόσο, ορισμένοι προγραμματιστές ενδέχεται να έχουν αντιρρήσεις ως προς την άδεια χρήσης της σειράς Llama 4.

Οι χρήστες και εταιρείες που εδρεύουν ή έχουν κύρια επαγγελματική δραστηριότητα στην ΕΕ απαγορεύεται να χρησιμοποιούν ή να διανέμουν τα μοντέλα αυτά — πιθανότατα λόγω των κανονισμών που απορρέουν από τη νομοθεσία περί τεχνητής νοημοσύνης και προστασίας προσωπικών δεδομένων της ΕΕ (η Meta έχει στο παρελθόν κατακρίνει αυτούς τους νόμους ως υπερβολικά αυστηρούς.)

Επιπλέον, όπως και στις προηγούμενες κυκλοφορίες Llama, εταιρείες με πάνω από 700 εκατομμύρια ενεργούς χρήστες το μήνα πρέπει να ζητήσουν ειδική άδεια από τη Meta, την οποία η εταιρεία μπορεί να εγκρίνει ή να απορρίψει κατά βούληση.

Όπως ανέφερε η Meta στο blog της:

Τα μοντέλα Llama 4 σηματοδοτούν την αρχή μιας νέας εποχής για το οικοσύστημα Llama. Είναι μόνο η αρχή για τη συλλογή Llama 4

Η σειρά Llama 4 είναι η πρώτη που χρησιμοποιεί την αρχιτεκτονική Mixture of Experts (MoE) — μια πιο αποδοτική υπολογιστικά προσέγγιση για εκπαίδευση και απάντηση σε ερωτήματα. Η αρχιτεκτονική MoE διασπά τα καθήκοντα επεξεργασίας δεδομένων σε επιμέρους υποκαθήκοντα και τα αναθέτει σε πιο μικρά, εξειδικευμένα υπομοντέλα.

Το Maverick, για παράδειγμα, διαθέτει 400 δισεκατομμύρια συνολικές παραμέτρους, αλλά μόνο 17 δισ. ενεργές παραμέτρους ανάμεσα σε 128 "ειδικούς" (experts). (Οι παράμετροι σχετίζονται με την ικανότητα επίλυσης προβλημάτων ενός μοντέλου.) Το Scout έχει 17 δισ. ενεργές παραμέτρους, 16 experts και 109 δισ. συνολικές παραμέτρους.

Σύμφωνα με δοκιμές της Meta, το Maverick — το οποίο χαρακτηρίζεται κατάλληλο για καθημερινή χρήση και συνομιλίες, όπως η δημιουργική γραφή — ξεπερνά σε ορισμένα benchmarks (κώδικας, λογική, πολυγλωσσικά κείμενα, μεγάλα συμφραζόμενα, εικόνες) μοντέλα όπως το GPT-4o της OpenAI και το Gemini 2.0 της Google. Ωστόσο, δεν φτάνει τις επιδόσεις πιο πρόσφατων μοντέλων όπως το Gemini 2.5 Pro, το Claude 3.7 Sonnet της Anthropic και το GPT-4.5 της OpenAI.

Το Scout υπερέχει σε εργασίες όπως η σύνοψη εγγράφων και η ανάλυση μεγάλων βάσεων κώδικα. Έχει μοναδικά τεράστιο παράθυρο συμφραζομένων: 10 εκατομμύρια tokens. (Τα tokens αντιστοιχούν σε αποσπάσματα ωμής γλώσσας — π.χ. η λέξη "φανταστικός" μπορεί να αναλυθεί σε "φαν", "τασ" και "τικός".) Με απλά λόγια, το Scout μπορεί να επεξεργάζεται εικόνες και εκατομμύρια λέξεις ταυτόχρονα, κάνοντάς το κατάλληλο για εξαιρετικά μεγάλα έγγραφα.

Το Scout μπορεί να «τρέξει» σε μία μόνο κάρτα Nvidia H100 GPU, ενώ το Maverick απαιτεί σύστημα Nvidia H100 DGX ή αντίστοιχο, σύμφωνα με την Meta.

Το Behemoth, που ακόμη δεν έχει κυκλοφορήσει, θα χρειαστεί ακόμη ισχυρότερο hardware. Η Meta αναφέρει ότι διαθέτει 288 δισ. ενεργές παραμέτρους, 16 experts και σχεδόν 2 τρισεκατομμύρια συνολικές παραμέτρους. Σε εσωτερικές μετρήσεις της Meta, το Behemoth ξεπερνά το GPT-4.5, το Claude 3.7 Sonnet και το Gemini 2.0 Pro (όχι όμως και το 2.5 Pro) σε αξιολογήσεις που εστιάζουν σε δεξιότητες STEM όπως η επίλυση μαθηματικών προβλημάτων.

Αξιοσημείωτο είναι ότι κανένα μοντέλο της σειράς Llama 4 δεν θεωρείται "μοντέλο λογικής" (reasoning model) όπως τα o1 και o3-mini της OpenAI. Τα μοντέλα λογικής επαληθεύουν τις απαντήσεις τους και είναι πιο αξιόπιστα — αλλά καθυστερούν περισσότερο στην απόκριση.

Η Meta προσθέτει ότι έχει ρυθμίσει τα μοντέλα Llama 4 ώστε να αρνούνται λιγότερο συχνά να απαντήσουν σε "αμφιλεγόμενες" ερωτήσεις. Δηλαδή, το Llama 4 μπορεί να απαντά σε πολιτικά και κοινωνικά ζητήματα που τα προηγούμενα μοντέλα απέφευγαν. Επίσης, φέρεται να είναι πολύ πιο ισορροπημένο στο ποιες ερωτήσεις απορρίπτει.

Αυτές οι ρυθμίσεις έρχονται σε μια περίοδο που ορισμένοι σύμμαχοι του Λευκού Οίκου κατηγορούν τα AI chatbots για πολιτική «αφύπνιση» ("wokeness").

Πολλοί στενοί συνεργάτες του πρώην προέδρου Ντόναλντ Τραμπ, όπως ο Ίλον Μασκ και ο «τσάρος» των κρυπτονομισμάτων και της AI Ντέιβιντ Σακς, έχουν κατηγορήσει τα δημοφιλή chatbots για λογοκρισία των συντηρητικών απόψεων. Ο Σακς στοχεύει κυρίως την OpenAI, λέγοντας ότι το ChatGPT είναι «προγραμματισμένο να είναι woke» και ψευδές όσον αφορά τα πολιτικά θέματα.

Στην πραγματικότητα, η προκατάληψη στα AI αποτελεί άλυτο τεχνικό πρόβλημα. Η ίδια η εταιρεία AI του Μασκ, xAI, έχει δυσκολευτεί να αναπτύξει chatbot που να μην ευνοεί ορισμένες πολιτικές απόψεις.

Αυτό δεν έχει εμποδίσει εταιρείες όπως η OpenAI από το να προσαρμόσουν τα μοντέλα τους ώστε να απαντούν σε περισσότερες ερωτήσεις, ακόμη και σε πιο ευαίσθητα ή αμφιλεγόμενα θέματα.

Ακολουθήστε το Sofokleousin.gr στο Google News
και μάθετε πρώτοι όλες τις ειδήσεις
Σχετικά Άρθρα