TECHin

Η Alibaba επενδύει $290 εκατ. σε νέο είδος τεχνητής νοοημοσύνης, χωρίς τα όρια των LLM


"AI World Models": Μια γέφυρα μεταξύ ψηφιακού και φυσικού κόσμου

Η επόμενη φάση της τεχνητής νοημοσύνης φαίνεται να μετατοπίζεται μακριά από τα chatbots και τα κλασικά γλωσσικά μοντέλα, προς συστήματα που «κατανοούν» και προσομοιώνουν τον πραγματικό κόσμο, μια μετάβαση που ήδη προσελκύει δισεκατομμύρια επενδύσεων.

Η Alibaba, μέσω της Alibaba Cloud, ηγείται επένδυσης ύψους 2 δισ. γουάν (περίπου 290 εκατ. δολάρια) στη startup ShengShu, δημιουργό του εργαλείου παραγωγής βίντεο Vidu.

Η κίνηση σηματοδοτεί μια στρατηγική στροφή: από τα παραδοσιακά μεγάλα γλωσσικά μοντέλα (LLMs), που βασίζονται κυρίως σε κείμενο, προς τα λεγόμενα "world models", συστήματα που εκπαιδεύονται σε πολυτροπικά δεδομένα όπως εικόνα, ήχο και φυσική αλληλεπίδραση.

Στόχος είναι η ανάπτυξη τεχνητής νοημοσύνης που δεν περιορίζεται στην κατανόηση της γλώσσας, αλλά μπορεί να προβλέπει και να αναπαριστά τη συμπεριφορά του πραγματικού κόσμου.

Γέφυρα μεταξύ ψηφιακού και φυσικού κόσμου

Η ShengShu σχεδιάζει να αξιοποιήσει τη νέα χρηματοδότηση για την ανάπτυξη ενός «γενικού world model», ικανού να συνδέει δύο μέχρι σήμερα διακριτούς κόσμους:

  • τον ψηφιακό κόσμο (AI βίντεο, gaming)
  • και τον φυσικό κόσμο (αυτόνομη οδήγηση, ρομποτική)

Ο ιδρυτής της εταιρείας, Zhu Jun, περιγράφει τον στόχο ως τη σύνδεση «αντίληψης και δράσης», επιτρέποντας στα συστήματα AI να κατανοούν και να προβλέπουν με συνέπεια την πραγματική συμπεριφορά.

Το μοντέλο Vidu Q3 Pro της εταιρείας συγκαταλέγεται ήδη στα κορυφαία εργαλεία δημιουργίας βίντεο από κείμενο και εικόνες, σε μια αγορά όπου ανταγωνίζεται λύσεις από την ByteDance και την Kuaishou, ενώ προηγείται χρονικά της διάθεσης εργαλείων όπως το Sora της OpenAI.

Αγώνας δρόμου για την επόμενη AI πλατφόρμα

Η Alibaba εντείνει τις τοποθετήσεις της στον χώρο, συμμετέχοντας και σε επενδύσεις όπως:

  • η Tripo AI (3D μοντέλα από φωτογραφίες)
  • η PixVerse (διαδραστικά AI βίντεο με στοιχεία world modeling)

Παράλληλα, αναπτύσσει δικά της ανοιχτά μοντέλα για βίντεο και, πιο πρόσφατα, λύσεις για ρομποτική.

Η σημασία των world models για το μέλλον της AI είναι κρίσιμη. Ειδικοί επισημαίνουν ότι η αναπαραγωγή της ανθρώπινης νοημοσύνης απαιτεί τρία στοιχεία: λογική σκέψη, κατανόηση του φυσικού κόσμου και συνεχή μάθηση - φυσικά οι μηχανές δε μπορούν να βιώσουν αυθεντικό συναίσθημα ή να έχουν συνείδηση, αλλά γίνεται προσπάθεια για την επίτευξη ό,τι πιο κοντινού είναι δυνατόν.

Τα LLM έχουν καλύψει κυρίως το πρώτο σκέλος, αφήνοντας ένα τεχνολογικό κενό που τα world models φιλοδοξούν να καλύψουν.

Η επένδυση στην ShengShu εντάσσεται στην ευρύτερη μετατόπιση του κλάδου από την «ευφυΐα της γλώσσας» στην «ευφυΐα της πραγματικότητας». Σε αυτή τη νέα φάση, το ζητούμενο δεν είναι απλώς να απαντά η AI, αλλά να κατανοεί, να προβλέπει και τελικά να δρα μέσα στον κόσμο.

Ακολουθήστε το Sofokleousin.gr στο Google News
και μάθετε πρώτοι όλες τις ειδήσεις
Σχετικά Άρθρα