Logo Visualitics - Esperti di Data Analysis
Tableau

Joins vs. Data Blending in Tableau: scopri le differenze!

Nei nostri precedenti articoli abbiamo trattato l’argomento joins , così come il data blending e le loro relative implementazioni. Oggi ci concentreremo sulle differenze tra i due metodi ed andremo a capire insieme quando utilizzare un join e quando invece è meglio applicare il data blending e viceversa. Innanzitutto, partiamo ponendoci qualche domanda:
  • Quante connessioni abbiamo all’interno del workbook?
  • Come sono collegate le fonti?
  • Quanti dati contengono le fonti?
  • Quali viste abbiamo bisogno di creare?
Una volta risposto a queste prime domande, abbiamo un quadro quasi completo per capire quale metodo è meglio applicare. Ma prima, facciamo un breve riepilogo: come funziona una join ed in cosa consiste invece il data blending. Consideriamo le seguenti tabelle appartenenti alla stessa fonte dati, ad esempio un file Excel costituito da due fogli, uno per ogni tabella: Tabella 1: (elenco clienti con ordini resi)
Cliente ID Nome Cliente Età Ordine ID Quantità ordine
1 Mario 27 76 50
2 Giovanni 55 77 20
3 Luca 18 78 30
4 Luisa 40 79 70
Tabella 2: (elenco ordini con stato reso o sospeso)
Ordine ID Quantità ordine Ordine Reso/sospeso
77 20 reso
78 30 reso
79 70 reso
79 15 sospeso
Attraverso una join stabiliamo e fissiamo una relazione tra di loro: pensiamo alla logica degli insiemi ed intersezioni ed immaginiamo le tabelle come due insiemi. Quindi supponiamo di voler creare una nuova tabella contenente solamente gli ordini con status “reso”. Andremo dunque ad utilizzare una inner join che prende soltanto i valori comuni ad entrambe le tabelle, ed imposteremo come chiave il campo Ordine ID. La nuova tabella sarà dunque così composta:
Cliente ID Nome Cliente Età Ordine ID Quantità ordine Ordine Reso/sospeso
2 Giovanni 55 77 20 reso
3 Luca 18 78 30 reso
4 Luisa 40 79 70 reso
Ricordiamo che ci sono altre 3 tipologie di join:
  • Nel caso della left join prendiamo tutte le righe della tabella 1 e relative informazioni associate della tabella 2; in mancanza di informazioni visualizziamo null
Cliente ID Nome Cliente Età Ordine ID Quantità ordine Ordine Reso/sospeso
1 Mario 27 76 50 null
2 Giovanni 55 77 20 reso
3 Luca 18 78 30 reso
4 Luisa 40 79 70 reso
  • Nel caso della right join prendiamo tutte le righe della tabella 2 e relative informazioni associate della tabella 1; in mancanza di informazioni visualizziamo null
Cliente ID Nome Cliente Età Ordine ID Quantità ordine Ordine Reso/sospeso
2 Giovanni 55 77 20 reso
3 Luca 18 78 30 reso
4 Luisa 40 79 70 reso
null null null 79.1 15 sospeso
  • Full Outer join: prendiamo tutte le righe di entrambe le tabelle:
Cliente ID Nome Cliente Età Ordine ID Quantità ordine Ordine Reso/sospeso
1 Mario 27 76 50 null
2 Giovanni 55 77 20 reso
3 Luca 18 78 30 reso
4 Luisa 40 79 70 reso
null null null 79 15 sospeso
In caso di data blending consideriamo nuovamente le due tabelle, ma supponiamo che si trovino in due datasource con origini differenti. La combinazione tra esse, a differenza delle join, non combina mai realmente i dati ma i risultati vengono aggregati al livello appropriato e presentati visivamente insieme nella vista. A questo punto andremo a caricarle separatamente su Tableau e poi a stabilire dal menu Data -> Edit blend relationship le chiavi di relazione, nel nostro caso “Order ID”. Successivamente in ogni foglio del workbook potremmo decidere quale delle due tabelle utilizzare come fonte primaria; inoltre possiamo anche decidere se attivare o meno la chiave di blend. Ad esempio, nel caso in cui volessimo mostrare tutti i clienti con stato reso appartenenti alla fonte n.1, utilizzeremo la datasource 1 come primaria e filtreremo tenendo in considerazione solo gli ordini resi. join vs blending Sia effettuando il data blending o scegliendo un join abbiamo ottenuto lo stesso risultato. Quindi quale è meglio usare? In generale, l’utilizzo di joins è consigliato rispetto al data blending per i seguenti motivi:
  • sono più performanti poiché il lavoro è svolto dal database e non dalla macchina locale;
  • ci sono poche limitazioni nell’utilizzo.
Tuttavia, non è tutto! Vediamo dunque nel dettaglio, pregi e difetti di entrambi i metodi. Di seguito, una tabella riassuntiva. Passa il mouse sulle icone per visualizzare maggiori informazioni.
Per leggere altri utili suggerimenti e continuare la tua formazione Tableau, puoi seguirci sui nostri canali social Linkedin e Facebook o iscriverti alla nostra nuova community LearnToViz, per commentare questo e gli altri contenuti con gli altri membri della piattaforma!

Iscriviti alla newsletter

Per restare informato sulle novità Tableau e Alteryx, sui nostri prodotti e servizi e sugli eventi Visualitics in programma, iscriviti alla nostra newsletter; potrai scegliere la tipologia di invio che preferisci e disiscriverti in qualsiasi momento!

Quali aggiornamenti vuoi ricevere?