Eficienţa energetică devine prioritate zero în AI: Google Cloud a lansat generaţia a 8-a de TPU şi arhitectura Agentic Data Cloud
Într-o perioadă în care consumul masiv de energie şi costurile de procesare devin principalele obstacole în scalarea inteligenţei artificiale, Google Cloud a anunţat săptămâna trecută lansarea a două noi arhitecturi hardware specializate: TPU 8t şi TPU 8i. Această strategie marchează o separare clară a sarcinilor de calcul, oferind un motor dedicat pentru antrenarea modelelor masive şi unul optimizat exclusiv pentru inferenţă, respectiv execuţia sarcinilor.
♦ Noile TPU 8t pentru antrenare oferă o performanţă de 3 ori mai mare faţă de generaţia anterioară şi o eficienţă flops per watt dublă faţă de competiţie. ♦ Sistemul TPU 8i, specializat pentru inferenţă, aduce o îmbunătăţire de 80% a memoriei SRAM şi o latenţă aproape de zero pentru agenţii de producţie. ♦ Securitate bazată pe agenţi: Noii agenţi pentru Threat Hunting şi detecţie automatizată identifică problemele de pe „dark web” cu o acurateţe de 98%.
Într-o perioadă în care consumul masiv de energie şi costurile de procesare devin principalele obstacole în scalarea inteligenţei artificiale, Google Cloud a anunţat săptămâna trecută lansarea a două noi arhitecturi hardware specializate: TPU 8t şi TPU 8i. Această strategie marchează o separare clară a sarcinilor de calcul, oferind un motor dedicat pentru antrenarea modelelor masive şi unul optimizat exclusiv pentru inferenţă, respectiv execuţia sarcinilor. Noua infrastructură, parte a conceptului AI Hypercomputer, integrează hardware-ul personalizat cu progrese majore în stocare şi networking pentru a oferi o eficienţă de calcul superioară, esenţială pentru organizaţiile care trec de la faza de testare la producţia de masă în era AI-ului agentic.
„Am proiectat aceste sisteme pentru a fi extrem de eficiente din punct de vedere al consumului de energie, deoarece am considerat că eficienţa energetică va deveni o constrângere pe măsură ce companiile continuă să scaleze atât procesele de antrenare, cât şi pe cele de inferenţă”, a declarat Thomas Kurian, CEO, Google Cloud.
Infrastructura hardware de generaţia a 8-a reprezintă un salt tehnologic semnificativ, fiind proiectată special pentru a susţine cerinţele modelelor Gemini şi ale agenţilor autonomi. Procesorul TPU 8t, optimizat pentru antrenare, este conceput ca un sistem de înaltă performanţă ce poate conecta până la 9.600 de cipuri într-o reţea de doi petabiţi, oferind acces direct la o memorie de dimensiuni similare în cadrul clusterului. Această configuraţie permite o îmbunătăţire de trei ori a performanţei faţă de generaţia anterioară, fiind capabilă să reducă timpul de dezvoltare a modelelor de frontieră de la luni la doar câteva săptămâni. În paralel, TPU 8i este motorul de raţionare optimizat pentru inferenţă eficientă din punctul de vedere al costurilor, având o latenţă aproape de zero. Acesta integrează o topologie avansată şi un motor de accelerare colectivă care permite gestionarea cache-urilor de date de mari dimensiuni, esenţiale pentru contextul extins al agenţilor AI moderni.
Pe lângă dezvoltarea propriilor cipuri, Google Cloud îşi menţine angajamentul pentru un ecosistem deschis, fiind una dintre primele platforme cloud care vor introduce GPU-urile NVIDIA VR200. Acestea vor funcţiona în tandem cu reţeaua de mare capacitate Virgo, o arhitectură avansată de reţea optimizată pentru AI care susţine clustere masive de antrenare. De asemenea, compania a introdus procesorul Axion, bazat pe tehnologia ARM (Advanced RISC Machines), destinat instanţelor de calcul tradiţionale necesare agenţilor care rulează pe sisteme de computaţie clasică. Performanţa hardware este susţinută de soluţii de stocare de ultimă generaţie, precum Managed Lustre, care atinge un debit de 10 terabiţi pe secundă, şi Rapid Storage, o nouă capacitate ce suportă până la 15 terabiţi pe secundă pentru a asigura o latenţă ultra-scăzută în procesele de inferenţă.
Contextul datelor este pilonul central al oricărui agent inteligent, iar Google Cloud abordează această nevoie prin arhitectura Agentic Data Cloud. Aceasta transformă platformele de date din depozite statice în motoare dinamice de raţionament, eliminând limitările structurale ale infrastructurilor legacy.

Thomas Kurian, CEO, Google Cloud: „În prezent, vedem o schimbare majoră: utilizatorii nu mai vor doar răspunsuri la întrebări sau asistenţă în sarcini creative, ci vor să delege fluxuri întregi de lucru către agenţi. Platforma noastră, infrastructura AI şi soluţiile de date sunt proiectate tocmai pentru a permite această delegare în siguranţă şi la scară largă.”
Securitatea cibernetică în era AI este regândită sub conceptul de apărare agentică, o platformă ce combină informaţiile Google despre ameninţări cu tehnologia de securitate Wiz. Thomas Kurian a explicat că, pe măsură ce inteligenţa artificială înţelege mai bine codul, ameninţările cibernetice devin tot mai sofisticate, necesitând o protecţie autonomă de la nivelul codului până în cloud. Noii agenţi Gemini pentru securitate pot scana dark web-ul cu o acurateţe de 98%, detectând proactiv tipare de atac şi prioritizând alertele pentru echipele de intervenţie. În plus, prin intermediul agenţilor, organizaţiile pot rula exerciţii continue de testare, verificare a compromisurilor şi remediere automată a vulnerabilităţilor atât la nivel de cod, cât şi de configuraţie.
„În prezent, vedem o schimbare majoră: utilizatorii nu mai vor doar răspunsuri la întrebări sau asistenţă în sarcini creative, ci vor să delege fluxuri întregi de lucru către agenţi. Platforma noastră, infrastructura AI şi soluţiile de date sunt proiectate tocmai pentru a permite această delegare în siguranţă şi la scară largă”, a adăugat Thomas Kurian.
Pentru a avansa securitatea în spaţiul digital, Google Cloud a anunţat şi evoluţia sistemului reCAPTCHA prin lansarea Fraud Defense. Această platformă este capabilă să evalueze legitimitatea şi nivelul de autorizare nu doar pentru utilizatorii umani, ci şi pentru boţi sau agenţi AI. Este o măsură vitală pentru securizarea parcursului comerţului digital, asigurând că agenţii pot descoperi produse şi finaliza tranzacţii în siguranţă. Totodată, sistemul centralizat de guvernanţă permite companiilor să definească politici stricte de acces la date, prevenind scurgerile de informaţii confidenţiale între departamente prin intermediul unui gateway de securitate ce monitorizează în timp real acţiunile fiecărui agent din reţea.
„AI Hypercomputer oferă fundaţia, Data Cloud oferă contextul, iar platforma noastră de agenţi asigură orchestrarea. Tehnologia există - acum este momentul să construiţi motorul de creştere”, a concluzionat Thomas Kurian, CEO, Google Cloud.
Urmărește Business Magazin
Citeşte pe zf.ro
Citeşte pe alephnews.ro
Citeşte pe fanatik.ro
Citeşte pe smartradio.ro
Citeşte pe comedymall.ro
Citeşte pe MonitorulApararii.ro
Citeşte pe MonitorulJustitiei.ro
Citeşte pe zf.ro













