L’intelligenza artificiale è più creativa dell’uomo, o no? A cercare di chiarire il tema è un nuovo studio che pone l’uomo contro la macchina per rispondere a questa semplice domanda e rivelare intuizioni che potrebbero andare al cuore della nostra stessa umanità.
Al centro di questa esplorazione ci sono infatti quattro compiti distinti, ognuno dei quali è stato realizzato per sondare vari aspetti del pensiero creativo:
- Il compito Usi alternativi, che sfida i partecipanti a immaginare nuovi usi per gli oggetti di uso quotidiano, superando i confini del pensiero convenzionale.
- Il compito Conseguenze, che esplora la capacità di prevedere gli effetti a catena di scenari ipotetici, spingendo l’immaginazione ai suoi limiti.
- Il compito Associazioni divergenti, che verifica la capacità di generare un elenco di sostantivi non correlati, mostrando l’ampiezza del pensiero concettuale.
- Il compito Combinazione visiva, che impegna i partecipanti a fondere immagini non correlate per tessere nuove narrazioni coese, evidenziando la capacità di sintesi e di creare armonia dalla diversità.
Ciò premesso, loo studio ha cercato un confronto equilibrato fra la creatività umana e le capacità del GPT-4: con 151 partecipanti umani abbinati a 151 casi di risposte del GPT-4, la valutazione si è concentrata sulla qualità, l’originalità e l’elaborazione delle idee, trascendendo le mere misure quantitative.
Per questa analisi non sono state utilizzate le tradizionali valutazioni umane, comunemente utilizzate per valutare i compiti di pensiero divergente. Lo studio ha invece preferito utilizzare lo strumento OCS (Open creativity scoring) per automatizzare il punteggio della distanza semantica, cogliendo così l’originalità delle idee in modo oggettivo, assegnando punteggi basati sulla lontananza (unicità) delle risposte.
Il metodo evita dunque i potenziali problemi legati all’uomo, come la stanchezza, i pregiudizi e il costo del tempo, che potrebbero influenzare il processo di assegnazione dei punteggi. L’approccio automatizzato di assegnazione dei punteggi è risultato correlato in modo robusto con le valutazioni umane, suggerendo che cattura efficacemente l’essenza della creatività senza la necessità di un gruppo separato di umani per valutare le risposte sia del braccio umano che dell’IA dello studio.
Vince l’intelligenza artificiale… o no?
I risultati dello studio comparativo offrono spunti interessanti sulla capacità creativa del GPT-4. In particolare, un test t a campione indipendente non ha rivelato differenze significative nella fluidità totale tra umani e GPT-4, indicando una parità di condizioni in termini di quantità di idee generate.
Tuttavia, il fulcro della creatività risiede nell’originalità e nell’elaborazione. Un’analisi dettagliata della varianza per l’originalità, basata sui punteggi della distanza semantica, ha evidenziato effetti principali significativi, a favore del GPT-4 indipendentemente dal prompt, con notevoli effetti di interazione tra gruppo e prompt, evidenziando le prestazioni superiori del GPT-4 in termini di originalità in diversi scenari.
Inoltre, confrontando i punteggi di elaborazione, che quantificano i dettagli di ogni risposta valida, le risposte del GPT-4 sono risultate significativamente più elaborate di quelle dei partecipanti umani. Per esempio, in risposta all’uso di una forchetta, dove un umano potrebbe semplicemente suggerire “come pettine per capelli”, l’elaborazione del GPT-4 comprenderebbe una narrazione più dettagliata, illustrando la sua capacità di tessere idee più ricche e complesse da un singolo prompt.
La creatività dell’intelligenza artificiale però è un po’ artificiosa
L’affidamento a sistemi di punteggio automatizzati, come lo strumento OCS, per la valutazione dei risultati creativi delle IA e degli esseri umani solleva interrogativi sulla natura stessa della creatività. Se da un lato questi sistemi possono valutare oggettivamente l’originalità e l’elaborazione delle risposte in base alla distanza semantica, dall’altro possono trascurare le qualità intrinseche e intangibili che la creatività umana incarna.
La creatività, nella sua forma più pura, è spesso vista come un’espressione di qualcosa di unicamente umano – alcuni potrebbero addirittura dire l’anima. È questa manifestazione dei pensieri e dei sentimenti più intimi che trascende la mera novità linguistica o concettuale. La preoccupazione che le idee generate dall’intelligenza artificiale, nonostante la loro originalità o complessità, possano mancare della profondità, dell’intenzionalità e della risonanza emotiva che la creatività umana possiede intrinsecamente è toccante.
In questo contesto, l’approccio dello studio, pur innovativo e rigoroso nella sua metodologia, potrebbe inavvertitamente trascurare questi aspetti qualitativi della creatività, portando alla percezione che gli sforzi creativi dell’IA, per quanto sofisticati, siano in qualche modo artificiosi, privi dell’anima che gli artisti umani infondono nelle loro creazioni.