Χρησιμοποιώντας αποκλειστικά κινεζικά τσιπς (ημιαγωγούς), η Ant Group, με τη στήριξη του Τζακ Μα, πέτυχε σημαντική πρόοδο στην τεχνητή νοημοσύνη, μειώνοντας το κόστος εκπαίδευσης AI μοντέλων κατά 20%, σύμφωνα με πηγές κοντά στην εταιρεία, τις οποίες επικαλείται το Bloomberg. Η Ant αξιοποίησε τσιπ από την Alibaba και τη Huawei για την εκπαίδευση μοντέλων μέσω της μεθόδου Mixture of Experts (MoE), επιτυγχάνοντας αποτελέσματα αντίστοιχα με εκείνα που προκύπτουν από τη χρήση των πανίσχυρων Nvidia H800.
Τα τελευταία περιλαμβάνονται στις αμερικανικές κυρώσεις και δεν μπορούν πλέον να εξαχθούν στην Κίνα. Αν και η Ant συνεχίζει να χρησιμοποιεί Nvidia για την ανάπτυξη τεχνητής νοημοσύνης, στα νεότερα μοντέλα της βασίζεται όλο και περισσότερο σε εναλλακτικές λύσεις, όπως τα τσιπ της AMD και εγχώριες επιλογές.
Αυτή η εξέλιξη υπογραμμίζει τη στροφή των κινεζικών εταιρειών προς εθνικές τεχνολογικές λύσεις, καθώς εντείνεται η κούρσα μεταξύ Κίνας και ΗΠΑ στην ανάπτυξη προηγμένων AI μοντέλων.
Η Ant δημοσίευσε πρόσφατα ερευνητική εργασία, σύμφωνα με την οποία οι τεχνικές της ξεπερνούν σε ορισμένες περιπτώσεις τα μοντέλα της Meta σε συγκεκριμένα benchmarks. Αν αυτή η διαπίστωση επιβεβαιωθεί, σηματοδοτεί ένα ακόμη βήμα προς την αυτονομία της Κίνας στον τομέα της τεχνητής νοημοσύνης.
Τα MoE μοντέλα έχουν αποκτήσει ιδιαίτερη απήχηση, καθώς επιτρέπουν πιο αποδοτική κατανομή των υπολογιστικών πόρων, μειώνοντας δραστικά το κόστος εκπαίδευσης. Η Ant ανέπτυξε τεχνικές που επιτρέπουν την εκπαίδευση μεγάλων γλωσσικών μοντέλων (LLMs) με χαμηλότερης ισχύος υλικό, μειώνοντας το κόστος εκπαίδευσης 1 τρισεκατομμυρίου tokens από 6,35 εκατομμύρια γουάν (περίπου 880.000 δολάρια) σε 5,1 εκατομμύρια γουάν.
Η Ant σκοπεύει να αξιοποιήσει τα νέα της μοντέλα, Ling-Plus και Ling-Lite, σε βιομηχανικές εφαρμογές, την υγειονομική περίθαλψη και τις χρηματοοικονομικές υπηρεσίες. Πρόσφατα, η εταιρεία απέκτησε την κινεζική διαδικτυακή πλατφόρμα Haodf.com, ενισχύοντας την παρουσία της στην υγειονομική τεχνητή νοημοσύνη. Παράλληλα, διαθέτει την εφαρμογή Zhixiaobao, έναν AI «βοηθό ζωής», καθώς και την AI χρηματοοικονομική σύμβουλο Maxiaocai.
Σύμφωνα με την Ant, το Ling-Lite υπερέχει σε αγγλόφωνα benchmarks έναντι ενός από τα μοντέλα Llama της Meta, ενώ και τα δύο μοντέλα της ξεπερνούν τις επιδόσεις του DeepSeek στα κινεζικά benchmarks. Το Ling-Lite διαθέτει 16,8 δισεκατομμύρια παραμέτρους, ενώ το Ling-Plus φτάνει τις 290 δισεκατομμύρια. Για σύγκριση, το DeepSeek-R1 διαθέτει 671 δισεκατομμύρια, ενώ το GPT-4.5 εκτιμάται ότι έχει περίπου 1,8 τρισεκατομμύρια, σύμφωνα με το MIT Technology Review.
Παρά τις προκλήσεις σταθερότητας που αντιμετώπισε η Ant κατά την εκπαίδευση των μοντέλων της – όπως απότομες αυξήσεις στο ποσοστό σφαλμάτων λόγω αλλαγών στο υλικό ή τη δομή του μοντέλου – η εταιρεία προχώρησε σε ανοικτό κώδικα για το Ling, ενισχύοντας περαιτέρω την καινοτομία στον κλάδο της τεχνητής νοημοσύνης στην Κίνα.