Cu doar câțiva ani în urmă, ideea că poți primi un apel de la o persoană dragă, să recunoști vocea aproape perfect și totuși să nu conversezi cu acea persoană părea o poveste dintr-un thriller tehnologic. În 2026, scenariul nu mai este fictiv. Tehnologiile de clonare vocală au devenit suficient de accesibile și convingătoare pentru a fi exploatate în scheme de fraudă bazate pe cele mai sensibile reacții: frică, urgență, autoritate și atașament față de familie.
Un apel telefonic nu mai reprezintă un pericol doar atunci când entitatea de la celălalt capăt solicită date bancare sau te convinge să instalezi o aplicație de control de la distanță. În noile forme de înșelăciune, vocea însuși devine instrumentul de atac. Poate fi vocea unui copil care afirmă că a avut un accident, a unui părinte care are nevoie urgentă de fonduri, a unui director care solicită o plată suspicioasă sau a unui funcționar oficial care pare să continue o discuție legitimă. Dacă tonul, pauzele și inflexiunile sonore par autentice, victima are mai puțin timp mental pentru a analiza dacă ceva este în neregulă.
Amenințarea este tot mai serios luată în considerare de autorități. Europol avertizează în rapoartele recente că clonarea vocală alimentată de inteligența artificială și deepfake-urile video amplifică capacitatea grupărilor infracționale de a comite fraude, extorcări și furt de identitate. FBI a raportat deja cazuri în care infractorii utilizează mesaje vocale generate de AI pentru a se da drept oficiali sau persoane de încredere, iar raportul IC3 pentru 2025 a dedicat o secțiune specială infracțiunilor conexe AI, cu pierderi estimate la aproape 893 de milioane de dolari în Statele Unite.
Cum se creează o voce falsă și de ce a devenit atât de periculoasă
Clonarea vocală nu mai necesită echipamente sofisticate sau laboratoare speciale. Comisia Federală pentru Comerț a SUA avertiza încă din 2023 că un escroc poate realiza o copie foarte realistă a vocii unei persoane plecând de la un fragment sonor scurt, extras dintr-un clip postat pe rețele sociale, dintr-un interviu, un mesaj video sau orice alt material public disponibil online. În 2026, instrumentele de generare vocală s-au perfecționat, devenind mai rapide, expresive și mai ușor de utilizat, reducând drastic barierele pentru infractori.
Din punct de vedere tehnic, deepfake-ul vocal nu se limitează la redarea mecanică a unor propoziții. Modelele avansate pot imita timbrul, ritmul, accentul, variațiile emoționale și ezitările naturale ale unei persoane. Aceste mici imperfecțiuni fac o voce să pară umană și, implicit, credibilă. Un apel prost realizat poate suna rigid și nenatural, dar unul realizat cu atenție, pe baza unui eșantion adecvat, poate păcăli chiar și un interlocutor stresat.
Frauda devine mai eficientă deoarece vocea falsă nu este folosită izolat. În multe situații, ea este integrată într-un plan de inginerie socială mai complex. Atacatorul poate avea deja informații despre membri ai familiei, locul de muncă, programul apropiatului sau alte detalii culese din postări publice. Apoi lansează apelul în momente strategice și creează o urgență aparent insurmontabilă. Când vocea pare familiară și povestea bazată pe realitate, victima reacționează adesea înainte de a verifica legitimitatea situației.
FBI avertizează în 2024 că infractorii folosesc tot mai frecvent tehnici de clonare audio și video pentru a impersona membri ai familiei, colegi sau parteneri de afaceri. Europol subliniază că aceste instrumente sporesc eficiența fraudelor deja cunoscute mai degrabă decât să creeze infracțiuni total noi, făcând schemele clasice mai credibile prin adăugarea unei măști tehnologice convingătoare.
De la „accidentul nepotului” la falsa ordine a șefului
Una dintre cele mai populare utilizări ale clonării vocale este fraudarea de tip „family emergency”. Victima primește un apel aparent de la fiul, nepotul, soția sau o persoană apropiată aflată în situație de criză. Scenariul poate implica un accident, reținerea de către autorități, internare de urgență sau pierderea unor documente importante în timpul unei călătorii. Vocea solicită bani imediat, de obicei prin transfer bancar, criptomonede sau carduri preplătite. Autoritățile precizează că această metodă devine și mai eficientă dacă vocea clonată a persoanei dragi este utilizată, deoarece panica scade vigilența și stimulează reacția rapidă.
Raportul IC3 pentru 2025 menționează explicit că fraudele de tip confidence sau romance scams, cu participarea AI, includ și schemelor de distres, în care tehnologia de clonare vocală imită vocea unei persoane aflate în pericol. Victimele au consemnat pierderi ce depășesc 19 milioane de dolari în această categorie, demonstrând că fenomenul nu mai este doar anecdotic, ci o realitate a criminalității digitale.
În mediul profesional, mecanismul se adaptează, dar rădăcina emoțională rămâne aceeași. Angajatul primește un apel de la director, director financiar sau partener important, în care sunt solicitate rapid plăți, transmiterea datelor bancare, aprobare a unor facturi sau transferuri către conturi „temporare”. Dacă vocea seamănă puternic cu cea a superiorului și cererea pare legată de un proiect real, reacția de conformare poate depăși protocoalele interne. FBI avertizează că infractorii utilizează clone audio și video pentru a convinge angajați să divulge informații sau să autorizeze tranzacții frauduloase.
Firma de inginerie Arup, cazul mediat în 2024, exemplifică cât de avansate pot deveni aceste înșelăciuni în cazul unei scenarii elaborate. Un angajat din Hong Kong a fost determinat să transfere aproximativ 20 de milioane de lire sterline după o videoconferință falsificată cu participanți care păreau colegi și superiori autentici. Deși a implicat și video, acest caz evidențiază aceeași tendință: identificarea unui individ după semnalele senzoriale nu mai este suficientă.
În 2026, apelurile de tip deepfake nu vizează doar victime individuale sau companii mari. O cercetare Hiya, citată de mai multe publicații, arată că unul din patru americani a primit un apel cu voce deepfake în ultimele 12 luni, iar aproape 25% nu sunt siguri dacă pot diferenția o voce falsă de una autentică. Deși aceste date sunt dintr-un sondaj comercial, ele indică faptul că percepția riscului s-a normalizat în mod semnificativ.
De ce telefonul rămâne canalul ideal pentru înșelăciune
Mesajele de tip phishing și emailurile frauduloase au dezvoltat pe parcurs anumite semnale de alarmă care sunt mai ușor de recunoscut. Greșelile gramaticale, linkurile suspecte, promisiunile excesive sau cererile neobișnuite pentru date sensibile pot declanșa suspiciuni. Pe de altă parte, apelul telefonic funcționează diferit. El comprimă timpul de reacție și introduce presiunea unei conversații în timp real. Nu poți pune apelul pe pauză, nu vrei să pari nepoliticos, iar ignorarea unei urgențe poate fi dificilă.
Deepfake-ul vocal exploatează această vulnerabilitate. Într-un mesaj vocal, o solicitare disperată poate părea mai credibil decât în format text. O voce tremurândă, recunoscută ca fiind a unei persoane apropiate, are o putere emotională sporită. De aceea, autoritățile avertizează în privința scenariilor care induc panică și solicită acțiuni rapide, fără alte verificări.
De asemenea, ecosistemul telecom permite tactici de creștere a credibilității, precum spoofing-ul numărului apelantului. Un escroc poate afișa un număr familiar sau local, sporind șansele ca apelul să nu fie ignorat. FBI explică că spoofing-ul manipulează încrederea victimei, determinându-i să divulge informații sensibile sau să transfere fonduri. Combinat cu clonarea de voce, rezultatul devine extrem de convingător.
Un alt risc este disponibilitatea celor mai multe materiale audio publice. În 2026, numeroase persoane apar în clipuri pe platforme precum TikTok, Instagram, YouTube, în podcasturi, interviuri video sau mesaje vocale distribuite în grupuri, care apoi pot fi reutilizate pentru clonare. Persoanele publice și profesioniștii care comunică des online sunt ținte mai ușor de păcălit, însă fragmentele scurte pot fi suficiente pentru inițierea unui proces de clonare, fiind tot mai ușor de accesat.