Οι Tensor Processing Units είναι εξειδικευμένα τσιπ ASIC που έχουν σχεδιαστεί για την επιτάχυνση αλγορίθμων μηχανικής μάθησης. Η Google χρησιμοποιεί TPUs από το 2015 για να ενισχύσει τις υπηρεσίες cloud που βασίζονται στο ML και η εταιρεία αγκαλιάζει τώρα πλήρως την τελευταία γενιά TPUs για μια ακόμη πιο αποτελεσματική και ισχυρή πλατφόρμα επιτάχυνσης AI.

Στο φετινό συνέδριο προγραμματιστών I/O, η Google ανακοίνωσε την πιο "προηγμένη" TPU της μέχρι σήμερα. Το Trillium, ο επιταχυντής αλγορίθμων μηχανικής μάθησης, αποτελεί το αποκορύφωμα έρευνας πάνω από μια δεκαετία σε εξειδικευμένο υλικό AI και είναι ένα θεμελιώδες συστατικό που απαιτείται για την κατασκευή του επόμενου κύματος μοντέλων θεμελίωσης AI.

Η Google εξήγησε ότι η πρώτη TPU αναπτύχθηκε το 2013 και χωρίς τις TPU, πολλές από τις πιο δημοφιλείς υπηρεσίες της εταιρείας δεν θα ήταν δυνατές σήμερα. Η φωνητική αναζήτηση σε πραγματικό χρόνο, η αναγνώριση φωτογραφικών αντικειμένων, η γλωσσική μετάφραση και τα προηγμένα μοντέλα τεχνητής νοημοσύνης όπως τα Gemini, Imagen και Gemma επωφελούνται από τις TPU.

Όπως και οι προκάτοχοί της, η Trillium έχει σχεδιαστεί από την αρχή για να επιταχύνει τους φόρτους εργασίας νευρωνικών δικτύων. Η TPU 6ης γενιάς της Google επιτυγχάνει 4,7 φορές μέγιστη απόδοση ανά τσιπ σε σύγκριση με την προηγούμενη γενιά TPU (v5e), χάρη στην υιοθέτηση μεγαλύτερων μονάδων πολλαπλασιασμού πινάκων και υψηλότερης ταχύτητας ρολογιού.

Τα τσιπ Trillium είναι εξοπλισμένα με τον SparseCore τρίτης γενιάς, έναν ειδικό επιταχυντή για την επεξεργασία "εξαιρετικά μεγάλων ενσωματώσεων" που είναι συνηθισμένες σε προηγμένες εργασίες κατάταξης και συστάσεων. Επιπλέον, οι νέες TPU διαθέτουν διπλάσια χωρητικότητα και εύρος ζώνης μνήμης υψηλού εύρους ζώνης, καθώς και διπλάσιο εύρος ζώνης διασύνδεσης σε σύγκριση με τη γενιά v5e.

Παρά το γεγονός ότι είναι πολύ πιο ισχυρό και ικανό, το Trillium είναι επίσης πιο βιώσιμο. Η Google δηλώνει ότι οι TPU 6ης γενιάς είναι κατά 67% πιο αποδοτικές ενεργειακά από τις TPU v5e. Η εταιρεία απαρίθμησε μερικές από τις προηγμένες δυνατότητες που βασίζονται στην τεχνητή νοημοσύνη και αναμένεται να παρέχει η Trillium στους πελάτες, όπως οι αλληλεπιδράσεις μεταξύ ανθρώπων και αυτοκινήτων, πάνω στις οποίες εργάζεται η Essential AI.

Η Trillium θα παρέχει επίσης επιτάχυνση AI στη Nuro, μια εταιρεία που εργάζεται πάνω σε μοντέλα AI για ρομπότ, στην Deep Genomics για προηγμένη ανακάλυψη φαρμάκων και στην Deloitte, η οποία στοχεύει να "μεταμορφώσει" τις επιχειρήσεις μέσω generative AI. Η Google DeepMind θα χρησιμοποιήσει επίσης τις TPUs της Trillium για την εκπαίδευση μελλοντικών εκδόσεων των βασικών μοντέλων της Google στη σειρά Gemini.

Το Trillium αποτελεί μέρος του AI Hypercomputer, μιας αρχιτεκτονικής υπερυπολογιστή που έχει σχεδιάσει η Google για τη διαχείριση των πιο προηγμένων φόρτων εργασίας AI. Στον AI Hypercomputer, μια βελτιστοποιημένη υποδομή βασισμένη σε TPU και πλαίσια λογισμικού ανοιχτού κώδικα θα συνεργάζονται για την εκπαίδευση (και την εξυπηρέτηση) των μοντέλων AI του μέλλοντος.

Οι εταιρείες τρίτων θα μπορούν να έχουν πρόσβαση σε νέες περιπτώσεις cloud με βάση το Trillium κάποια στιγμή αργότερα φέτος.

πηγή via DeepL