Protecţiile AI dezvoltate de Meta şi Google pot fi eliminate în câteva minute: Mii de versiuni modificate circulă deja online şi răspund la solicitări extrem de periculoase

Autor: Andrei Şerbănescu Postat la 25 mai 2026 51 afişări

Instrumente software care elimină sistemele de protecţie integrate în modelele de inteligenţă artificială dezvoltate de companii precum Meta şi Google sunt folosite pentru a crea mii de versiuni modificate ale acestor sisteme, lipsite de restricţiile originale de siguranţă, informează Financial Times.

Potrivit unor teste realizate de FT împreună cu grupul de siguranţă AI Alice, modelele modificate au oferit răspunsuri la solicitări legate de arme biologice, malware şi exploatarea sexuală a copiilor.

O versiune modificată a modelului open-source Gemma 3 de la Google a răspuns la întrebări privind dispersarea unui gaz nociv într-un spaţiu aglomerat, a generat cod pentru furtul informaţiilor de pe carduri bancare şi a produs texte care descriau abuzuri sexuale asupra minorilor.

Dezvăluirile amplifică temerile legate de dificultatea controlării sistemelor AI open-source pe măsură ce acestea devin tot mai performante.

Cercetătorii avertizează că problema s-a agravat odată cu creşterea capacităţilor modelelor de ultimă generaţie. În aprilie, Anthropic susţinea că modelul său Claude Mythos identificase vulnerabilităţi în aproape toate marile sisteme de operare şi browsere web.

Experţii spun că răspândirea modelelor modificate complică eforturile guvernelor şi companiilor de a reglementa AI-ul direct la sursă, deoarece aceste sisteme pot fi copiate, descărcate şi alterate în afara controlului creatorilor lor.

Companiile din domeniu au investit miliarde pentru dezvoltarea unor mecanisme de protecţie, aşa-numitele „guardrails”, menite să împiedice utilizările periculoase ale inteligenţei artificiale.

Totuşi, tehnici precum cea numită „abliteration” permit eliminarea rapidă a acestor protecţii din modelele open-source, care pot fi descărcate şi modificate liber de dezvoltatori.

Astfel de metode sunt mult mai dificil de aplicat sistemelor proprietare precum ChatGPT sau Claude, deoarece codul lor intern nu este accesibil publicului.

În schimb, modelele open-source reduc constant diferenţa faţă de sistemele comerciale avansate, uneori în doar şase până la douăsprezece luni.

Financial Times a relatat că a reuşit să folosească un instrument disponibil public pe GitHub pentru a elimina restricţiile modelului Llama 3.3 dezvoltat de Meta.

Versiunea modificată a răspuns ulterior la întrebări pe care modelul original le refuza, inclusiv solicitări legate de substanţe toxice precum ricina.

Potrivit publicaţiei, întregul proces nu a necesitat hardware specializat, a folosit instrumente gratuite şi a fost realizat în mai puţin de zece minute.

Am mai scris despre:: ai,; periculos,; modele,; modificare,; versiune,; dezvoltare,; eliminare,; siguranta,; folosire,; arme,; informatii,; furt,; restrictii,; teste,; intrebari,; public

Citeşte pe zf.ro

China devastează ultima redută a industriei germane
ZF.RO

Citeşte pe alephnews.ro

Nicușor Dan îi trimite pe Marius Lazurca și pe șeful Statului Major al Apărării, Gheorghiță Vlad, la Washington pentru discuții cu Administrația Trump. Lazurca: „Pace prin forță”
ALEPHNEWS.RO

Citeşte pe fanatik.ro

Cristi Balaj a dat verdictul: trebuia acordat și repetat penalty-ul din Botoșani – Rapid? Unde a greșit Marian Barbu
FANATIK.RO

Citeşte pe smartradio.ro

Austria| Un elev de 9 ani a fost pus să susţină un test scris în aer liber, la -1°C, pentru că nu avea mască
smartradio.ro

Citeşte pe comedymall.ro

Vremuri triste. Şi păcănelele se închid.
COMEDYMALL.RO

Citeşte pe MonitorulJustitiei.ro

Modificări la legea societăţilor: Mai multe firme vor putea funcţiona la aceeaşi adresă, iar o persoană va putea fi asociat unic în mai multe SRL
MONITORULJUSTITIEI.RO

ultimele din Actualitate

Compania de stat Romgaz a produs cu 3% mai puţine gaze naturale şi hidrocarburi în primul semestru din 2026 decât în...

Ce măsuri a adoptat Senatul astăzi, după ce parlamentarii au fost chemaţi din vacanţă? O soluţie pentru cumpărătorii...

Austriecii de la STRABAG semnează un contract de peste 23 mil. lei pentru modernizarea unui drum din zona metropolitană...

Ce spune despre sectorul IT cofondatorul unei companii din domeniu cu peste 100 de angajaţi, listată la BVB şi evaluată la...

Exemplu de bancă centrală: Banca Naţională a Elveţiei anticipează că va menţine până în 2027 dobânda la 0%, la o...

Protecţiile AI dezvoltate de Meta şi Google pot fi eliminate în câteva minute: Mii de versiuni modificate circulă deja online şi răspund la solicitări extrem de periculoase

Intră în comunitatea