Nel mondo della intelligenza artificiale (IA), le previsioni di un imminente “collasso del modello” stanno guadagnando sempre più attenzione. I cosiddetti profeti e giornalisti dell’IA avvertono che i sistemi di IA generativa potrebbero essere destinati a un catastrofico declino di qualità. Ma quanto sono fondate queste previsioni e che cos’è realmente il collasso del modello?
Il termine “collasso del modello” è emerso con crescente discussione nel 2023, ma ha guadagnato popolarità più recentemente. Esso descrive uno scenario ipotetico in cui i futuri sistemi di IA diventano progressivamente meno efficaci a causa dell’accumulo di dati generati dall’IA stessa su Internet. Questo fenomeno è noto come “allenamento rigurgito” e si verifica quando i modelli di IA apprendono esclusivamente da dati creati da altri modelli di IA, piuttosto che da dati umani.
I moderni sistemi di IA sono progettati attraverso il processo di apprendimento automatico. Sebbene i programmatori stabiliscano le strutture matematiche di base, l’effettiva “intelligenza” deriva dall’addestramento dei modelli a riconoscere e imitare schemi nei dati. Tuttavia, i sistemi di IA generativa hanno bisogno di dati di alta qualità e in grandi quantità per funzionare efficacemente.
Per soddisfare questa necessità, le grandi aziende tecnologiche come OpenAI, Google, Meta e Nvidia raccolgono enormi volumi di dati da Internet. Questa raccolta include terabyte di contenuti, i quali alimentano i modelli di IA. Con l’ascesa dei sistemi di IA generativa ampiamente accessibili e utili nel 2022, l’uso di contenuti generati dall’IA è diventato sempre più comune. Tuttavia, nel 2023, i ricercatori hanno iniziato a interrogarsi se fosse possibile allenare i modelli di IA esclusivamente con dati generati dall’IA stessa.
C’è un forte incentivo a utilizzare contenuti generati dall’IA per l’addestramento dei modelli. Questi dati sono meno costosi da ottenere rispetto ai dati umani e non presentano problematiche etiche o legali. Tuttavia, i ricercatori hanno scoperto che l’uso eccessivo di dati sintetici può portare a una diminuzione della qualità e della diversità dei modelli. In altre parole, i modelli di IA che apprendono da dati generati da altri modelli diventano progressivamente meno utili e più simili tra loro.
Le grandi aziende tecnologiche non possono semplicemente escludere i contenuti generati dall’IA dalla loro raccolta dati. Già oggi, queste aziende spendono notevoli risorse per pulire e filtrare i dati. Un insider del settore ha recentemente rivelato che, talvolta, fino al 90% dei dati raccolti viene scartato prima dell’addestramento dei modelli.
Man mano che cresce la necessità di escludere specificamente i contenuti generati dall’IA, il processo di filtraggio diventa sempre più complesso. Inoltre, la distinzione tra contenuti umani e contenuti generati dall’IA diventa più difficile con il passare del tempo, rendendo il filtraggio e la rimozione dei dati sintetici sempre più sfumati e onerosi.
Nonostante le preoccupazioni, il rischio di un catastrofico collasso del modello potrebbe essere esagerato. La maggior parte delle ricerche finora si è concentrata sui casi in cui i dati sintetici sostituiscono completamente i dati umani. Nella pratica, è più probabile che i dati umani e quelli generati dall’IA coesistano, riducendo il rischio di collasso.
Un futuro più realistico potrebbe vedere un ecosistema di piattaforme di IA generativa diversificate piuttosto che un modello monolitico. Questa diversificazione potrebbe contribuire a una maggiore resilienza contro il collasso del modello. È essenziale, quindi, che le autorità di regolamentazione promuovano la concorrenza nel settore dell’IA e finanzino lo sviluppo tecnologico di interesse pubblico per sostenere un’industria sana e competitiva.
Oltre al rischio di un collasso del modello, ci sono altre preoccupazioni legate all’uso crescente di contenuti generati dall’IA.
Una delle preoccupazioni principali è l’impacto negativo sulla qualità del bene pubblico digitale. Ad esempio, si è osservato un calo del 16% nell’attività su StackOverflow, un popolare sito di codifica, dopo il lancio di ChatGPT. Questo suggerisce che l’assistenza dell’IA potrebbe ridurre le interazioni umane in alcune comunità online.
L’iperproduzione di contenuti basati sull’IA, come le farm di contenuti, ha portato a una proliferazione di materiali di bassa qualità e clickbait. È diventato sempre più difficile per gli utenti distinguere tra contenuti umani e contenuti generati dall’IA, creando una sovrabbondanza di materiale pubblicitario e poco informativo.
Un approccio potenziale per affrontare questi problemi è l’implementazione di watermark o etichettature sui contenuti generati dall’IA. Alcuni paesi, come l’Australia, hanno già introdotto legislazioni temporanee in tal senso.
Un altro rischio significativo è la possibile perdita di diversità socio-culturale. L’omogeneizzazione dei contenuti generati dall’IA potrebbe minacciare la ricchezza delle prospettive culturali e sociali disponibili online. È fondamentale avviare ricerche interdisciplinari per comprendere le sfide sociali e culturali che questi sistemi pongono.
In conclusione, mentre il collasso del modello rappresenta una preoccupazione reale, è importante considerare che i dati umani rimarranno essenziali per il futuro dell’IA. È cruciale proteggere l’integrità dei dati umani e continuare a esplorare soluzioni per mantenere la qualità e la diversità dei contenuti digitali. Solo attraverso uno sforzo congiunto tra le aziende tecnologiche, i ricercatori e le autorità di regolamentazione possiamo garantire un futuro sostenibile e innovativo per l’intelligenza artificiale.
Il commerciante di auto usate può utilizzare il regime speciale IVA del margine per gli…
I fulmini uccidono 320 milioni di alberi ogni anno: uno studio senza precedenti Un innovativo…
I cartoni per pizza sono sicuri? Gli oli minerali contaminano il cibo? Quali rischi per…
Come rigenerare i denti persi? Quali sono le nuove scoperte in medicina rigenerativa? Come cambierà…
Quest'oggi, un terremoto di magnitudo 8,8 ha colpito le coste della penisola di Kamchatka, una…
TERREMOTO OGGI - Un terremoto di magnitudo 8.6 (Mw 8.8 secondo l'USGS) è stato rilevato dalla…
This website uses cookies.