Perché dovresti fondere quando puoi già partecipare a Tableau?

Combinazione dei dati in Tableau: un metodo utilizzato quando sono presenti dati correlati in più origini dati, che si desidera analizzare insieme in un'unica vista.

In un mondo che genera e consuma 2,5 quintilioni di byte di dati al giorno, le organizzazioni sono obbligate a cercare nuovi metodi per trasformare e combinare i dati al fine di raggiungere l'efficienza ottimale. Uno di questi metodi per combinare i dati è Unione dei dati in Tableau .

Ora, poiché questo serve a uno scopo così importante nel ciclo dei dati di una data organizzazione, rappresenta un modulo molto essenziale nella maggior parte dei casi . In questo blog, discuteremo i seguenti concetti:





Perché hai bisogno della fusione dei dati in Tableau?

Supponiamo che tu sia un Tabella sviluppatore che ha dati transazionali archiviati in Salesforce e dati sulle quote archiviati in Access. I dati che si desidera combinare vengono archiviati in database diversi e la granularità dei dati acquisiti in ciascuna tabella è diversa nelle due origini dati, quindi la fusione dei dati è il modo migliore per combinare questi dati.

La fusione dei dati è utile nelle seguenti condizioni:



  1. Si desidera combinare i dati di database diversi che non sono supportati dai join tra database.

    I join tra database non supportano le connessioni ai cubi (ad esempio, Oracle Essbase) o ad alcune connessioni di sola estrazione (ad esempio, Google Analytics). In questo caso, impostare singole origini dati per i dati che si desidera analizzare, quindi utilizzare l'unione dei dati per combinare le origini dati su un unico foglio.

  2. I dati sono a diversi livelli di dettaglio.

    A volte un set di dati acquisisce i dati utilizzando vari file livelli di dettaglio vale a dire, maggiore o minore granularità rispetto all'altro set di dati.

    Si supponga, ad esempio, di analizzare dati transazionali e dati sulle quote. I dati transazionali potrebbero acquisire tutte le transazioni. Tuttavia, i dati sulle quote potrebbero aggregare le transazioni a livello di trimestre. Poiché i valori transazionali vengono acquisiti a diversi livelli di dettaglio in ogni set di dati, è necessario utilizzare l'unione dei dati per combinare i dati.



    funzione di ordinamento in c ++

Che cos'è la fusione dei dati in Tableau?

La fusione dei dati è una funzionalità molto potente in Quadro . Viene utilizzato quando sono presenti dati correlati in più origini dati, che si desidera analizzare insieme in un'unica vista. È un metodo per combinare i dati che integra una tabella di dati da un'origine dati con colonne di dati da un'altra origine dati.

Di solito, utilizzi i join per eseguire questo tipo di combinazione di dati, ma a volte, a seconda di fattori come il tipo di dati e la sua granularità, è meglio utilizzare la combinazione di dati.

In cosa è diverso dall'unione dei dati?

La fusione dei dati simula un join sinistro tradizionale. La principale differenza tra i due è quando l'unione viene eseguita rispetto all'aggregazione.

Unisciti a sinistra

Quando si utilizza un join sinistro per combinare i dati, viene inviata una query al database in cui viene eseguito il join. L'utilizzo di un join sinistro restituisce tutte le righe della tabella di sinistra e tutte le righe della tabella di destra che ha una corrispondenza di riga corrispondente nella tabella di sinistra. I risultati del join vengono quindi inviati di nuovo e aggregati da Tableau.

Ad esempio, supponi di avere le seguenti tabelle. Se le colonne comuni sono ID utente , un join sinistro prende tutti i dati dalla tabella di sinistra, così come tutti i dati dalla tabella di destra perché ogni riga ha una corrispondenza di riga corrispondente nella tabella di sinistra.

Unione dati - Unione dati in Tableau - EdurekaUnione dei dati

Quando si utilizza l'unione dei dati per combinare i dati, viene inviata una query al database per ciascuna origine dati utilizzata nel foglio. I risultati delle query, inclusi i dati aggregati, vengono restituiti e combinati da Tableau. La vista utilizza tutte le righe dell'origine dati primaria, la tabella di sinistra e le righe aggregate dell'origine dati secondaria, la tabella di destra, in base alla dimensione dei campi di collegamento.

cosa sono i big data hadoop

È possibile modificare il campo di collegamento o aggiungere altri campi di collegamento per includere righe di dati diverse o aggiuntive dall'origine dati secondaria nella combinazione, modificando i valori aggregati.

Ad esempio, supponi di avere le seguenti tabelle. Se i campi di collegamento sono ID utente in entrambe le tabelle la fusione dei dati prende tutti i dati dalla tabella di sinistra e integra la tabella di sinistra con i dati della tabella di destra. In questo caso, non tutti i valori possono far parte della tabella risultante per i seguenti motivi:

  • Una riga nella tabella di sinistra non ha una corrispondenza di riga corrispondente nella tabella di destra, come indicato dal valore null.
  • Sono presenti più valori corrispondenti nelle righe della tabella di destra, come indicato dall'asterisco (*).

Supponiamo di avere le stesse tabelle di cui sopra, ma l'origine dati secondaria contiene un nuovo campo chiamato Finalità . Di nuovo, se il campo di collegamento è ID utente , l'unione dei dati prende tutti i dati dalla tabella di sinistra e li integra con i dati della tabella di destra. In questo caso, vengono visualizzati lo stesso valore null e gli stessi asterischi nell'esempio precedente oltre a quanto segue:

  • Perché il Finalità è una misura, vengono visualizzati i valori di riga perFinalitàcampo aggregato prima che i dati nella tabella di destra siano combinati con i dati nella tabella di sinistra.
  • Come nell'esempio precedente, una riga nella tabella di sinistra non ha la riga corrispondente per Finalità campo, come indicato dal secondo valore nullo.

Quando sostituire l'adesione Miscelazione

1. I dati devono essere puliti.

Se le tabelle non corrispondono correttamente tra loro dopo un join, configura le origini dati per ciascuna tabella, apporta le personalizzazioni necessarie (ovvero, rinomina le colonne, modifica i tipi di dati delle colonne, crea gruppi, utilizza calcoli, ecc.) quindi utilizzare la fusione dei dati per combinare i dati.

2. I join causano dati duplicati.

I dati duplicati dopo un join sono un sintomo di dati a diversi livelli di dettaglio. Se noti dati duplicati, invece di creare un join, utilizza la fusione dei dati per fondersi su una dimensione comune.

3. Hai molti dati.

In genere, i join sono consigliati per combinare i dati dallo stesso database. I join vengono gestiti dal database, che consente ai join di sfruttare alcune delle funzionalità native del database. Tuttavia, se si lavora con set di dati di grandi dimensioni, i join possono mettere a dura prova il database e influire in modo significativo sulle prestazioni. In questo caso, la fusione dei dati potrebbe aiutare. Poiché Tableau gestisce la combinazione dei dati dopo che i dati sono stati aggregati, ci sono meno dati da combinare. Quando ci sono meno dati da combinare, generalmente, le prestazioni migliorano.

come creare una stringa casuale in java

Unione dei dati in Tableau

È possibile utilizzare la fusione dei dati quando si hanno dati in origini dati separate che si desidera analizzare insieme su un unico foglio. Tableau ha due origini dati integrate denominate Sample-superstore e Esempio di catena di caffè.mdb che verrà utilizzato per illustrare la fusione dei dati.

Passaggio 1: connettiti ai tuoi dati e configura le origini dati

  • Connettiti a un set di dati e imposta l'origine dati nella pagina dell'origine dati. Un isorgente dati incorporata Esempio di catena di caffè.mdb ,che è un file di database di MS Access, verrà utilizzato per illustrare la fusione dei dati.
  • Vai a Dati > Nuova origine dati, connettersi al secondo set di dati.Questo esempio utilizza l'estensione Campione - Superstore fonte di dati. Then impostare l'origine dati.
  • Fare clic sulla scheda del foglio per iniziare a creare la visualizzazione.

Passaggio 2: designare un'origine dati primaria

  • Trascina almeno un campo dall'origine dati principale nella vista per designarlo come origine dati principale. Nel Dati fare clic sull'origine dati che si desidera designare come origine dati primaria. In questo esempio, Assaggia la catena del caffè è selezionato.
  • La seguente schermata mostra le diverse tabelle e join disponibili nel file.

Passaggio 3: designare un'origine dati secondaria

  • I campi utilizzati nella vista da origini dati che non sono l'origine dati primaria o collegamenti attivi designano automaticamente le origini dati successive come l'origine dati secondaria. In questo caso, Sample Superstore.

Passaggio 4: unisci i dati

  • Ora puoi integrare i dati di entrambe le fonti sulla base di una dimensione comune ( Stato , in questo caso). Tieni presente che accanto alla dimensione - Stato viene visualizzata una piccola immagine di collegamento. Ciò indica la dimensione comune tra le due origini dati.
  • Supponi di creare un grafico a barre con Rapporto di profitto nello scaffale a colonna e Stato nel Row Shelf, il grafico mostra come varia il rapporto di profitto per ogni stato sia nei supermercati che nelle catene di caffè.

Limitazioni della fusione dei dati in Tableau

  1. Esistono alcune limitazioni alla combinazione di dati per gli aggregati non additivi, come MEDIANO , e RAWSQLAGG .
  2. La fusione dei dati compromette la velocità delle query con granularità elevata.
  3. Quando si tenta di ordinare in base a un campo calcolato che utilizza dati combinati, il campo calcolato non è elencato nell'elenco a discesa Campo della finestra di dialogo Ordina.
  4. Le origini dati del cubo possono essere utilizzate solo come origine dati primaria per l'unione dei dati in Tableau. Non possono essere utilizzati come origini dati secondarie.

Spero che tutti voi, ora, abbiate una buona idea Unione dei dati in Tableau da questo blog. Affamato di più conoscenza? Non preoccuparti, questo video ti darà una migliore comprensione del concetto.