Με στόχο να κάνει την Τεχνητή Νοημοσύνη (ΑΙ) χρήσιμη για όλους η Google έκανε σειρά ανακοινώσεων στο πλαίσιο της διεξαγωγής του φετινού Google I/O, που πραγματοποιήθηκε στην Καλιφόρνια. Επίκεντρο των ανακοινώσεων είναι το Gemini, το μεγαλύτερο και πιο ικανό μοντέλο AI της Google.
Όπως αναφέρει η εταιρεία, πριν ένα χρόνο στη σκηνή του I/O για πρώτη φορά η Google μοιράστηκε τα σχέδια της για το Gemini, μια οικογένεια μοντέλων AI πολυτροπικής απεικόνισης, τα οποία είναι ικανά να συλλογίζονται χρησιμοποιώντας κείμενο, εικόνες, βίντεο, κώδικα και άλλα.
Στο φετινό Google I/O, όπως αναφέρεται σε ανακοίνωση, «η Google έδειξε πως λειτουργεί πλήρως στην εποχή του Gemini, παρουσιάζοντας καινοτόμες λύσεις AI σε προϊόντα, έρευνα και υποδομή, καθώς και πώς αυτό μας φέρνει πιο κοντά στον τελικό στόχο, που είναι να κάνουμε την Τεχνητή Νοημοσύνη χρήσιμη για όλους».
Όλα τα προϊόντα της Google με περισσότερους από δύο δισεκατομμύρια χρήστες όπως ανακοινώθηκε είναι φτιαγμένα με την τεχνολογία Gemini.
Στην εκδήλωση δόθηκε έμφαση στο πώς αυτό βοηθά τους πολίτες να δημιουργήσουν νέες εμπειρίες και να κάνουν τα προϊόντα της Google ακόμα πιο χρήσιμα.
Ειδικότερα, η Google ανακοίνωσε μεταξύ άλλων, απευθυνόμενη απευθείας στο ευρύ κοινό:
«* Επέκταση των AI Overviews στην Αναζήτηση. Με ένα νέο προσαρμοσμένο μοντέλο Gemini — ικανό για συλλογισμό πολλαπλών βημάτων, σχεδιασμό και πολυτροπικότητα — σε συνδυασμό με την καλύτερη Αναζήτηση στην κατηγορία, θα μπορείτε σύντομα να κάνετε σύνθετες ερωτήσεις πολλαπλών βημάτων, να προσαρμόζετε τα αποτελέσματα αναζήτησης και ακόμη και να κάνετε ερωτήσεις με βίντεο
* Παρουσιάζοντας το Ask Photos. Πάνω από έξι δισεκατομμύρια φωτογραφίες ανεβαίνουν κάθε μέρα στο Google Photos. Με τις πολυτροπικές δυνατότητες του Gemini, επαναπροσδιορίζουμε τον τρόπο με τον οποίο μπορείτε να αναζητήσετε τις φωτογραφίες και τα βίντεο σας. Θέλετε να βρείτε μια συγκεκριμένη ανάμνηση ή να ανακαλέσετε πληροφορίες που είναι κρυμμένες στη συλλογή σας; Απλά ρωτήστε το Ask Photos.
* Νέοι τρόποι αλληλεπίδρασης με το Gemini στο Workspace. Οι δυνατότητες του Gemini θα επεκταθούν σε περισσότερους χρήστες και θα ενσωματωθούν στο πλαϊνό πλαίσιο του Gmail, των Docs, του Drive, των Slides και των Sheets. Επιπλέον, λειτουργίες του Gemini θα προστεθούν και στην εφαρμογή Gmail για κινητά.
* Gemini για Android. Δημιουργούμε τεχνολογία AI απευθείας στο λειτουργικό σύστημα Android. Οι μαθητές μπορούν τώρα να λάβουν βοήθεια στις ασκήσεις τους κυκλώνοντας προβλήματα με το Circle to Search. Η επικάλυψη του Gemini θα παρέχει δυναμικές προτάσεις σχετικά με το τι υπάρχει στην οθόνη σας. Για παράδειγμα, μπορείτε να ζητήσετε να σας συνοψίσει ένα PDF ή να χρησιμοποίησετε την επιλογή «Ρωτήστε Αυτό το Βίντεο». Επιπλέον, το TalkBack με την υποστήριξη του Gemini θα μπορεί να παρέχει ακόμα πιο λεπτομερείς περιγραφές εικόνων».
Επίσης, η Google ανακοίνωσε ότι λάνσαρει «το Gemini 1.5 Pro στους συνδρομητές του Gemini Advanced σε περισσότερες από 35 γλώσσες, μαζί με μία σειρά ενός εκατομμυρίου ακολουθιών κειμενικών χαρακτήρων που τα LLM μετατρέπουν σε αριθμητικές αναπαραστάσεις. Το Gemini 1.5 Pro αποτελεί το μεγαλύτερο από οποιοδήποτε ευρέως διαθέσιμο chatbot για καταναλωτές σε ολόκληρο τον κόσμο. Αυτό σημαίνει ότι μπορεί να κατανοήσει περισσότερες πληροφορίες από ποτέ, όπως ένα αρχείο PDF 1.500 σελίδων, ενώ σύντομα θα μπορεί να κατανοήσει 30.000 γραμμές κώδικα καθώς και βίντεο διάρκειας μιας ώρας».
Οι συνδρομητές του Gemini Advanced θα αποκτήσουν σύντομα πρόσβαση στο Live, μια νέα εμπειρία συνομιλίας μέσω κινητού. «Με το Live, θα έχετε τη δυνατότητα να μιλήσετε στο Gemini και να επιλέξετε από μία ευρεία γκάμα διαφορετικών φωνών με φυσικό ήχο. Επίσης, θα μπορείτε να μιλήσετε με τον δικό σας ρυθμό, έχοντας τη δυνατότητα να διακόψετε με ερωτήσεις, κάνοντας τις συνομιλίες πιο εύληπτες», αναφέρει η Google.
Ανακοινώθηκε επίσης ότι η Google συνεργάζεται στενά με τη δημιουργική κοινότητα για να διερευνήσει πώς η παραγωγική τεχνητή νοημοσύνη μπορεί να υποστηρίξει καλύτερα τη δημιουργική διαδικασία καθώς και για να διασφαλίστει ότι τα εργαλεία για την Tεχνητή Nοημοσύνη είναι όσο το δυνατόν πιο χρήσιμα σε κάθε στάδιο:
* Παρουσιάστηκε το Veo, το πιο ικανό μοντέλο για τη δημιουργία βίντεο υψηλής ευκρίνειας, και το Imagen 3, ένα μοντέλο, το οποίο έχει την υψηλότερη ποιότητα στη μετατροπή κειμένου σε εικόνα. Επίσης, κάποιες νέες ηχογραφήσεις— με συμμετέχοντες καλλιτέχνες από όλο τον κόσμο — που έχουν δημιουργηθεί με το Music AI Sandbox.
Φυσικά, αυτές οι εξελίξεις στην Τεχνητή Νοημοσύνη μπορούν να υλοποιηθούν μόνο μέσω μιας πραγματικά πρωτοποριακής υποδομής τεχνολογίας. Η εκπαίδευση υπερσύγχρονων μοντέλων απαιτεί μεγάλη υπολογιστική ισχύ.
* Παρουσιάστηκε το Trillium, το TPU 6ης γενιάς, το οποία προσφέρει βελτίωση 4,7 φορές στην υπολογιστική απόδοση ανά τσιπ σε σύγκριση με την προηγούμενη γενιά, το TPU v5e. Θα είναι διαθέσιμο στους πελάτες Cloud αργότερα μέσα στη χρονιά.
Βασικό συστατικό της τολμηρής καινοτομίας είναι η υπεύθυνη καινοτομία. Έτσι, αναπτύσσουμε μια τεχνολογία αιχμής που ονομάζεται "AI-assisted red teaming" και βασίζεται σε καινοτόμα χαρακτηριστικά παιχνιδιών που έχει αναπτύξει η Google DeepMind, όπως το AlphaGo, επεκτείνοντας τις τεχνικές μας καινοτομίες υδατογράφησης, όπως το SynthID, σε δύο νέες μορφές - κείμενο και βίντεο- έτσι ώστε το περιεχόμενο που δημιουργείται από το AI να είναι πιο εύκολο να εντοπιστεί.
Χρησιμοποιώντας τη δύναμη του Gemini, στοχεύουμε να κάνουμε την Τεχνητή Νοημοσύνη χρήσιμη για όλους. Αποστολή της Google είναι να οργανώσει τις πληροφορίες του κόσμου από κάθε πηγή, να τις κάνει προσβάσιμες μέσω οποιουδήποτε τρόπου και να συνδυάσει τις παγκόσμιες πληροφορίες με τις δικές σας, με τρόπο που να είναι πραγματικά χρήσιμο για εσάς. Το Gemini θα μας βοηθήσει να φτάσουμε σε αυτόν τον στόχο, τονίζεται επίσης.