Data visualization

“Perché Sanremo è Sanremo”: la storia della canzone italiana con Tableau

E’ di nuovo quel momento dell’anno: l’appuntamento con Sanremo ormai ha più i tratti di una liturgia che quelli di una manifestazione canora. L’attesa diventa spasmodica per i futuri grandi successi che faranno il loro debutto sul palco dell’Ariston e ci accompagneranno per lungo tempo ai falò in spiaggia, al karaoke, in radio. E già sappiamo anche che i testi delle canzoni presto diventeranno tormentoni, scritte sui muri e dediche d’amore.

Non è mai stato difficile rispecchiarsi nelle emozioni interpretate dagli artisti in gara e nelle loro parole e a chiunque sarà capitato di sentirsi perfettamente descritto in quelle frasi.

Quanto sarebbe difficile, invece, indagare le emozioni più ricorrenti nei testi del pop italiano? Sarebbe possibile coglierne i cambiamenti, le evoluzioni nel tempo? E se sì, cosa ci racconta la storia della nostra canzone?

Per rispondere a queste domande, tre studenti del Master in Big Data Analytics & Social Mining dell’Università di Pisa Anna Romani, Elisabetta Sperandeo e Salvatore Bellomo –  si sono rivolti al professor Alessandro Lenci, esperto di studi linguistici dell’Università di Pisa. Insieme al suo team di ricerca, Lenci ha sviluppato ItEm (Italian Emotive Lexicon), un progetto di catalogazione che ha aiutato ad associare emozioni e parole tramite classificazioni manuali e strumenti informatici.

I tre studenti hanno quindi sviluppato diverse analisi su un gran numero di testi della storia della canzone italiana per poi rappresentarli con Tableau: vediamo nel dettaglio cosa hanno scoperto.

1951-2020: 69 anni di pop italiano

Per quel che riguarda i dati, la base di partenza sono stati i versi di più di 4500 canzoni rappresentative della musica italiana tra il 1951 e il 2020. Per aumentare la portata informativa, sono stati considerati non solo i testi cantati a Sanremo, ma anche quelli dei successi delle classifiche musicali e del cantautorato italiano.

Con l’aiuto di ItEm, in seguito, il gruppo ha misurato il valore emotivo associato a ogni parola, suddividendo per decade i risultati ottenuti: le analisi sono state limitate a sei emozioni di base:  rabbia, paura, gioia, tristezza, disgusto, sorpresa, anticipazione e fiducia.

Fiducia e poi rabbia: tutto cambia negli anni ‘70

La trendline ci aiuta a interpretare i nostri dati e a definire un andamento piuttosto costante nelle emozioni osservate. Iniziamo con gli anni Cinquanta  – Celentano prende in prestito le innovazioni musicali che arrivano dagli States e fa impazzire le nuove generazioni con il suo ritmo travolgente, mentre nei testi delle canzoni fiducia e paura sono preponderanti. Anche la gioia parte da un valore elevato, quindi si può dire che la musica trasmette vibrazioni positive. Tutto ciò potrebbe essere correlato al momento storico in corso: la guerra è finita da poco, l’Italia si lecca ancora le ferite mentre la Repubblica appena nata ci proietta in un futuro incerto ma nonostante tutto è troppo forte la voglia di andare avanti e riscattarsi.

Cresce sensibilmente la fiducia negli anni Sessanta, che segue un trend opposto rispetto a gioia e paura, mentre fa capolino la rabbia. Il ventaglio di emozioni cantate cambia e si amplia, ed è proprio quello che sta succedendo anche alla società: da un lato il benessere raggiunto con il boom economico, dall’altro le scosse nel mondo politico e i moti del ’68.
Questo cambiamento si sublima negli anni Settanta, quando la rabbia raggiunge il suo primo apice, mentre c’è sempre meno spazio per la sorpresa. Questa decade rappresenta una frattura con quello che è stato e ciò che sarà: da ora in poi l’andamento delle emozioni principali nel corso dei decenni futuri risulterà più costante, con meno fluttuazioni.

Ma gli italiani non sono mai tristi? Contrariamente a quanto si potrebbe pensare, leggendo i dati la tristezza accompagna stabilmente tutti i decenni, ma finisce per essere l’emozione meno rappresentata.
 

 

Parole, parole parole…

Ma soffermiamoci meglio sulle parole: non grideremo alla scoperta dell’America quando emerge che è l’amore il tema più frequente, come possiamo dedurre dalla top10 rappresentata nella sankey tra i decenni.

Per ottenere risultati più significativi è preferibile usare un approccio diverso: la teoria della text analysis ci dice che le parole più cariche di significato sono quelle più rare e, allo stesso tempo, condivise tra più documenti (nel nostro caso, quindi, le canzoni). Grazie a questo tipo di analisi è stato possibile evidenziare i termini più caratterizzanti ogni decade: la wordcloud realizzata per visualizzare questo lavoro è decisamente interessante!

(fonti: Annotatore T2K^2, ltEm)

Hai letto gli altri articoli sulla data visualization con Tableau? Puoi recuperarli qui!