Trasformazioni di Informatica: il cuore e l'anima di Informatica PowerCenter



Ottieni una comprensione completa di ciò che è Trasformazioni di Informatica e ottieni una panoramica sulle varie principali trasformazioni di Informatica con casi d'uso.

Le trasformazioni di Informatica sono oggetti di repository che possono leggere, modificare o passare dati alle strutture di destinazione definite come tabelle, file o qualsiasi altra destinazione richiesta. Una trasformazione è fondamentalmente utilizzata per rappresentare un insieme di regole, che definiscono il flusso di dati e il modo in cui i dati vengono caricati nelle destinazioni. Informatica PowerCenter fornisce più trasformazioni, ciascuna al servizio di una particolare funzionalità.Inoltre, con Informatica leader nel mercato odierno nella piattaforma di integrazione dei dati, Informatica Transformations si presenta come un concetto cruciale richiesto per .

Per comprendere meglio Informatica Transformations, dobbiamo prima capire cos'è la mappatura? Una mappatura è una raccolta di oggetti di origine e di destinazione collegati tra loro da un insieme di trasformazioni. Quindi le trasformazioni in una mappatura rappresentano le operazioni che il servizio di integrazione eseguirà sui dati durante l'esecuzione del flusso di lavoro. Per ottenere una migliore comprensione del flusso di lavoro, puoi consultare il nostro blog Tutorial di Informatica: gestione del flusso di lavoro





Quali sono le varie trasformazioni di Informatica?

Le trasformazioni di Informatica possono essere principalmente classificate in due categorie. In primo luogo si basa sulla connettività (collegamento nella mappatura) delle trasformazioni tra loro e il secondo si basa sulla modifica del numero complessivo di righe tra l'origine e la destinazione. Cominciamo dando uno sguardo alle trasformazioni di Informatica basate sulla connettività.

1) Tipi di trasformazioni in Informatica basate sulla connettività:



  • Trasformazioni connesse.
  • Trasformazioni non connesse.

In Informatica, le trasformazioni collegate a una o più trasformazioni sono chiamate come Trasformazioni connesse .

Le trasformazioni connesse vengono utilizzate quando per ogni riga di input viene chiamata una trasformazione e si prevede che restituisca un valore. Ad esempio, è possibile utilizzare una trasformazione di ricerca connessa per conoscere i nomi di ogni dipendente che lavora in un reparto specifico specificando l'ID reparto nell'espressione di ricerca.

Alcune delle principali trasformazioni di Informatica connesse sono Aggregator, Router, Joiner, Normalizer, ecc.



Vengono chiamate quelle trasformazioni che non sono collegate ad altre trasformazioni Trasformazioni non connesse .La loro funzionalità viene utilizzata chiamandoli all'interno di altre trasformazioni come la trasformazione Expression. Queste trasformazioni non fanno parte della pipeline di mapping.

Le trasformazioni non connesse vengono utilizzate quando la loro funzionalità è richiesta solo in base a determinate condizioni.Ad esempio, come programmatore desideri eseguire un'operazione complicata sui datinon si desidera utilizzare trasformazioni di Informatica come trasformazioni di espressioni o filtri per eseguire questa operazione. In tal caso, è possibile creare una DLL esterna o una libreria condivisa UNIX con i codici per eseguire l'operazione e richiamarli nella trasformazione della procedura esterna.

Ci sono 3 trasformazioni di Informatica, vale a dire. Procedura esterna, ricerca e stored procedure che possono essere scollegate in una mappatura valida (mappatura che può essere eseguita dal servizio di integrazione).

2) Tipi di trasformazioni di Informatica in base alla modifica del numero di righe

  • Trasformazioni attive
  • Trasformazioni passive

Trasformazioni attive :- Una trasformazione attiva può eseguire una delle seguenti azioni:

  • Modificare il numero di righe che passano attraverso la trasformazione: ad esempio, la trasformazione Filtro è attiva perché rimuove le righe che non soddisfano la condizione del filtro.
  • Modificare il limite di transazione: un limite di transazione è un limite che racchiude tutte le transazioni prima che venga chiamato un commit o tra due chiamate di commit. Ad esempio, durante un'operazione transazionale, l'utente sente che dopo determinate transazioni è richiesto un commit e chiama il comando commit per creare un punto di salvataggio e così facendo l'utente modifica il limite di transazione predefinito. Per impostazione predefinita, il limite della transazione si trova tra l'inizio del file e il punto di commit automatico o EOF.
  • Modificare l'attributo rowtype: l'attributo Rowtype è un tipo di record che rappresenta una riga in una tabella. Il record può memorizzare un'intera riga di dati selezionati dalla tabella o recuperare da un puntatore o da una variabile del puntatore. Ad esempio, la trasformazione della strategia di aggiornamento contrassegna il tipo di riga come 0 per l'inserimento di valori, 1 per l'aggiornamento, 2 per l'eliminazione o 3 per il rifiuto.
  • Aggregator, Filter, Joiner, Normalizer, ecc. Sono alcuni esempi di trasformazione attiva.

Trasformazione passiva : Una trasformazione passiva è quella che soddisferà tutte queste condizioni:

  • Il numero di righe prima e dopo la trasformazione è lo stesso.
  • Mantiene il confine della transazione.
  • Mantiene l'attributo rowtype.
  • Expression, ExternalProcedure, HTTP e così via sono alcuni esempi di trasformazione passiva.

Nella trasformazione passiva, non vengono create nuove righe o le righe esistenti vengono eliminate.

Ti starai chiedendo perché vengono utilizzate trasformazioni passive se non cambiano il numero di righe. Sono generalmente utilizzati per aggiornare i valori, chiamando una procedura esterna da una libreria condivisa e per definire l'input e l'output dei maplet. Un maplet è una raccolta delle sole trasformazioni dalla mappatura. Ad esempio, per un database di studenti desideriamo aggiornare i valori della colonna dei voti in percentile invece che in percentuale, questo puòessere fatto utilizzando una trasformazione di espressione che convertirà i valori e si aggiornerà nelle stesse colonne mantenendo il numero complessivo di righe uguale dopo le trasformazioni.

Non ci sono limitazioni per cui se una trasformazione viene utilizzata come trasformazione passiva, non può essere utilizzata in seguito come trasformazione attiva. Allo stesso modo, una trasformazione non connessa può essere utilizzata come trasformazione connessa secondo le esigenze. Tutte le possibili combinazioni possono essere formate tra queste categorie e questa è la magia delle trasformazioni di Informatica. Avrai un'idea migliore più avanti in questo blog sui possibili tipi a cui può appartenere una trasformazione.

Ora che abbiamo capito i vari tipi di trasformazioni di Informatica, iniziamo ad esplorarli.Di seguito sono riportati alcuni tipi principali di trasformazioni di Informatica:

Trasformazione genere Descrizione
AggregatoreAttivo connessoEsegue calcoli aggregati.
EspressionePassivo connessoCalcola un valore.
GiavaAttivo connesso o passivo connessoEsegue la logica utente codificata in Java. Il bytecode per la logica utente è archiviato nel repository
FalegnameAttivo connessoUnisce i dati da diversi database o file system flat.
ConsultareAttivo connesso o Passivo connesso o Attivo non connesso o Passivo non connessoRicerca e restituzione di dati da un file flat, una tabella relazionale, una vista o un sinonimo.
NormalizzatoreAttivo connessoUtilizzato nella pipeline per normalizzare i dati da origini file relazionali o flat.
RangoAttivo connessoLimita i record a un intervallo superiore o inferiore.
RouterAttivo connessoInstrada i dati in più trasformazioni in base alle condizioni del gruppo.
SQLAttivo connesso o passivo connessoEsegue query SQL su un database.
UnioneAttivo connessoUnisce i dati da diversi database o flat file system.
Generatore XMLAttivo connessoLegge i dati da una o più porte di input e restituisce XML tramite una singola porta di output.
Parser XMLAttivo connessoLegge XML da una porta di input e invia i dati a una o più porte di output.
Qualificatore di origine XMLAttivo connessoRappresenta le righe che il servizio di integrazione legge da un'origine XML quando esegue una sessione.

Cominciamo ora a guardare le trasformazioni una per una.

Trasformazione dell'aggregatore

La trasformazione dell'aggregatore è una trasformazione attiva e connessa. Questa trasformazione di Informatica è utile per eseguire calcoli come medie e somme (principalmente per eseguire calcoli su più righe o gruppi). Ad esempio, per calcolare il numero totale di vendite giornaliere o per calcolare la media delle vendite mensili o annuali. Le funzioni aggregate come AVG, FIRST, COUNT, PERCENTILE, MAX, SUM e così via possono essere utilizzate nella trasformazione aggregata.

Trasformazione della ricerca

La trasformazione della ricerca è la trasformazione di Informatica più popolare e ampiamente utilizzata. In base ai requisiti dell'utente, la trasformazione di ricerca può essere utilizzata come trasformazione Connesso o Non connesso combinandola come trasformazione Attiva o Passiva. iot viene utilizzato principalmente per cercare i dettagli da un'origine, un qualificatore di origine o una destinazione al fine di ottenere i dati richiesti pertinenti. Puoi anche cercare un 'file flat', una 'tabella relazionale', una 'vista' o un 'sinonimo'. È possibile utilizzare più trasformazioni di ricerca in una mappatura.

La trasformazione della ricerca viene creata con il seguente tipo di porte (punti logici per il trasferimento delle informazioni):

  • Porta di ingresso (I)
  • Porta di uscita (O)
  • Cerca porte (L)
  • Porta di ritorno (R) (solo in caso di ricerca non connessa)

Differenze tra la trasformazione della ricerca connessa e non connessa:

tipi di dati in mysql con esempi
  • La ricerca connessa riceve i valori di input direttamente dalla pipeline di mappatura, mentre la ricerca UnConnected riceve i valori dalla ricerca espressione da un'altra trasformazione. Una mappatura in Informatica può contenere Sorgente, Trasformazioni e Obiettivi collegati insieme sono considerati come una pipeline.
  • La ricerca connessa restituisce più colonne della stessa riga in quanto hanno più porte di ritorno, doveSLa ricerca UnConnected ha una sola porta di ritorno e restituisce una colonna da ogni riga. Ad esempio, se utilizziamo una ricerca connessa su un database dei dipendenti per un ID reparto specifico come parametro, possiamo ottenere tutti i dettagli relativi ai dipendenti di quel reparto come i loro nomi, numero ID dipendente, indirizzo, ecc., Mentre con una ricerca non connessa possiamo ottenere solo un attributo del dipendente come il suo nome o il numero ID dipendente o qualsiasi attributo specificato dall'utente.
  • La ricerca connessa memorizza nella cache tutte le colonne di ricerca, mentre la ricerca UnConnected memorizza nella cache solo l'output della ricerca e le condizioni di ricerca.
  • La ricerca connessa supporta valori predefiniti definiti dall'utente, mentre la ricerca non connessa non supporta i valori definiti dall'utente. Ad esempio, se si desidera modificare tutti i valori di una determinata colonna in NULL dopo la ricerca, è possibile impostare il valore predefinito di quelle colonne su NULL nelle espressioni di ricerca. Questa funzione non è tuttavia possibile in caso di ricerca UnConnected.

Supponiamo che da un database di clienti, desidero conoscere i dettagli dei clienti che hanno più di una fattura non annullata. Per ottenere questi dati, possiamo utilizzare una trasformazione di ricerca.

Ecco i passaggi.

  1. Inizia caricando la tabella Invoice come origine nel mapping designer. Nel caso in cui non sia chiaro come caricare i dati di origine nel Designer, Clicca qui . lookup-source-informatica trasformazioni-edureka
  2. Cerchiamo ora di filtrare le fatture che non vengono annullate. A tale scopo, creare un nuovo filtro denominato fil_ODS_CUSTOMER_ACTIVE al qualificatore di origine con la proprietà NOT (ISNULL (DATE_CLOSED)) AND CANCELED = 0.
  3. Ora aggiungi una trasformazione di ricerca nel designer come mostrato di seguito con il nome come lkp_CUSTOMER :

  4. Specificare la tabella di ricerca come tabella dei clienti.
  5. Fare doppio clic sull'intestazione di lkp_CUSTOMER per aprire il menu di modifica. Nella scheda Condizione impostare la condizione di ricerca come CUST_ID = CUST_NO.
  6. Nella scheda Proprietà modificare le informazioni di connessione in $ Source e fare clic su ok per salvare la trasformazione:
  7. Collega il file lkp_CUSTOMER porti a ODS_CUSTOMER_ACTIVE porte per completare la trasformazione richiesta dove ODS_CUSTOMER_ACTIVE è il file di destinazione richiesto:
  8. La mappa iconica finale che include la trasformazione della ricerca dovrebbe essere la seguente:

Trasformazione dell'espressione

La trasformazione dell'espressione è una trasformazione passiva e connessa di Informatica. Le trasformazioni di espressione vengono utilizzate per la manipolazione per riga. Per qualsiasi tipo di manipolazione che desideri eseguire su un singolo record, utilizza una trasformazione Espressione. La trasformazione Espressione accetta i dati per riga, li manipola e li passa alla destinazione. Ad esempio, per calcolare lo sconto per ogni prodotto o per concatenare nomi e cognomi o per convertire le date in un campo stringa.

Trasformazione del falegname

La trasformazione Joiner è una trasformazione di Informatica attiva e connessa utilizzata per unire due origini eterogenee. La trasformazione joiner unisce le origini in base a una condizione specificata che corrisponde a una o più coppie di colonne tra le due origini. Le due pipeline di input includono una pipeline principale e una pipeline o un ramo di dettaglio. Per unire più di due origini, è necessario unire l'output della trasformazione del joiner con un'altra origine. Per unire n numero di sorgenti in una mappatura, sono necessarie n-1 trasformazioni di joiner. La trasformazione Joiner supporta i seguenti tipi di join:
  • Normale
  • Master Outer
  • Dettaglio esterno
  • Esterno completo
Normale join elimina tutte le righe di dati dall'origine principale e di dettaglio che non corrispondono, in base alla condizione. Maestro esterno join elimina tutte le righe senza corrispondenza dall'origine principale e mantiene tutte le righe dall'origine dettagli e le righe corrispondenti dall'origine principale. Dettaglio oute r join conserva tutte le righe di dati dall'origine principale e le righe corrispondenti dall'origine dettagli. Elimina le righe senza corrispondenza dall'origine dettagli. Esterno completo join conserva tutte le righe di dati sia dall'origine principale che da quella dei dettagli.

Non possiamo unire più di due fonti utilizzando un unico joiner. Per unire tre sorgenti, abbiamo bisogno di due trasformazioni di joiner.

Supponiamo di voler unire tre tavoli - Dipendenti, Dipartimenti e Sedi - utilizzando Joiner. Avremo bisogno di due falegnami. Joiner-1 si unirà, dipendenti e dipartimenti e Joiner-2 si uniranno, l'output della tabella Joiner-1 e Locations.

Ecco i passaggi:

  1. Porta tre fonti nel designer di mappe.
  2. Crea il Joiner -1 per unire dipendenti e dipartimenti utilizzando Department_ID.

  3. Crea il prossimo falegname, Joiner-2. Prendi l'output da Joiner-1 e le porte dalla tabella delle posizioni e portali a Joiner-2. Unisci queste due origini dati utilizzando Location_ID.
  4. L'ultimo passaggio è inviare il richiestoportidal Joiner-2 al target o tramite un'espressionetrasformazionealla tabella di destinazione.

Trasformazione dell'Unione

La trasformazione dell'Unione è una trasformazione di Informatica attiva e connessa. Viene utilizzato per unire più set di dati da vari flussi o pipeline in un set di dati. Questa trasformazione di Informatica funziona in modo simile al comando UNION ALL in SQL ma non rimuove le righe duplicate. Si consiglia di utilizzare un aggregatore per rimuovere i duplicati che non sono previsti nella destinazione.

Trasformazione normalizzatore

Normalizzatore La trasformazione è una trasformazione di Informatica attiva e connessa. È una delle trasformazioni di Informatica più utilizzate principalmente con sorgenti COBOL in cui la maggior parte delle volte i dati vengono archiviati in formato denormalizzato. Inoltre, la trasformazione Normalizer può essere utilizzata per creare più righe da una singola riga di dati.

Proviamo a caricare un file flat di dati separato da virgole da un file flat / Cobol Source.

Ecco i passaggi:

java cast double a int
  1. Inizia caricando il negozio (file flat) con il nome del negozio e le entrate trimestrali:
  2. Crea una nuova trasformazione Normalizer denominata NRM_STORE_EXP con due porte Store e Quarter (si ripete 4 volte perché abbiamo dati per 4 trimestri) come mostrato di seguito:
  3. La scheda delle porte dovrebbe essere come mostrato di seguito:
  4. Copia / collega le seguenti colonne e connettiti a Normalizer Transformation.
    Negozio
    Quarter1
    Quarter2
    Quarter3
    Quarter4
    La mappatura dovrebbe apparire come segue:
  5. Crea una nuova trasformazione dell'espressione con exp_STORE . Copia / collega le seguenti colonne e connettiti a Expression Transformation come mostrato di seguito:
    Negozio
    Trimestre
    GK_QUARTER
    GCID_QUARTER
  6. Collegare l'espressione alla destinazione finale per completare la mappatura utilizzando la trasformazione di normalizzazione.

Trasformazione XML

Le trasformazioni XML sono una trasformazione di Active and Connected Informatica. Nelle trasformazioni di Informatica, la trasformazione XML viene utilizzata principalmente quando il file di origine è di tipo XML o i dati sono di tipo XML. La trasformazione XML può essere classificata principalmente in 3 trasformazioni:

  • Trasformazione del qualificatore di origine XML.
  • Trasformazione parser XML.
  • Trasformazione del generatore XML.

Qualificatore di origine XML Trasformazione : XML Source Qualifier è una trasformazione attiva e connessa. XML Source Qualifier viene utilizzato solo con una definizione di origine XML. Rappresenta gli elementi di dati che Informatica Server legge quando esegue una sessione con origini XML. XML Source Qualifier ha una porta di input o di output per ogni colonna nell'origine. Se si rimuove una definizione di origine XML da una mappatura, Designer rimuove anche la trasformazione corrispondente del qualificatore di origine XML.

Trasformazione parser XML: XML Parser Transformation è una trasformazione attiva e connessa. La trasformazione XML Parser viene utilizzata per estrarre XML all'interno di una pipeline e quindi passarlo alla destinazione. L'XML viene estratto dai sistemi di origine come file o database. La trasformazione Parser XML legge i dati XML da una singola porta di input e scrive i dati su una o più porte di output.

Trasformazione del generatore XML: XML Generator è una trasformazione attiva e connessa. La trasformazione XML Generator viene utilizzata per creare XML all'interno di una pipeline. XML Generator Transformation legge i dati da una o più porte di input e restituisce XML tramite una singola porta di output.

Trasformazione di grado

La trasformazione del rango è una trasformazione attiva e connessa. È una trasformazione di Informatica che ti aiuta a selezionare il primo o l'ultimo rango di dati. Ad esempio, per selezionare le prime 10 regioni in cui il volume delle vendite era molto elevato o per selezionare i 10 prodotti con il prezzo più basso.

Considera di voler caricare il primo e l'ultimo record in una tabella di destinazione dal mio database dei dipendenti. L'idea alla base di questo è aggiungere un numero di sequenza ai record e quindi prendere il primo grado e l'ultimo primo posto dai record.

  1. Trascina e rilascia le porte dal qualificatore di origine a due trasformazioni di rango.
  2. Creare un generatore di sequenze riutilizzabile con valore iniziale 1 e collegare il valore successivo a entrambe le trasformazioni di rango.
  3. Imposta le proprietà della classifica come segue. La porta della sequenza appena aggiunta dovrebbe essere scelta come Porta di rango. Non è necessario selezionare alcuna porta come Group by Port.Rank - 1
  4. Rango - 2
  5. Crea due istanze del bersaglio.Collega la porta di uscita alla destinazione.

Trasformazione del router

Il router è una trasformazione attiva e connessa. È simile alla trasformazione del filtro. L'unica differenza è che la trasformazione del filtro elimina i dati che non soddisfano la condizione, mentre il router ha un'opzione per acquisire i dati che non soddisfano la condizione. È utile testare più condizioni. Dispone di gruppi di input, output e predefiniti.

Supponiamo che desideri separare i record pari e dispari di una tabella, questo può essere fatto utilizzando una trasformazione del router.

L'idea è di aggiungere un numero di sequenza ai record e quindi dividere il numero di record per 2. Se è divisibile, spostalo su un obiettivo pari e, in caso contrario, spostalo su un obiettivo dispari.

  1. Trascina la sorgente e connettiti a una trasformazione dell'espressione.
  2. Aggiungi il valore successivo di un generatore di sequenze alla trasformazione dell'espressione.
  3. Nella trasformazione dell'espressione crea due porte, una è 'dispari' e un'altra 'pari'.
  4. Scrivi l'espressione come sotto
  5. Collega una trasformazione del router all'espressione.
  6. Crea due gruppi sotto la trasformazione del router.
  7. Dare la condizione come sotto
  8. Quindi invia i due gruppi a obiettivi diversi. Questo è l'intero flusso.

Spero che questo blog sulla trasformazione di Informatica sia stato utile per costruire la tua comprensione sulle varie trasformazioni di Informatica e abbia creato abbastanza interesse per saperne di più su Informatica.

Se hai trovato utile questo blog, puoi anche consultare la nostra serie di blog Tutorial di Informatica e Tutorial di Informatica: capire 'Inside Out' di Informatica .Se stai cercando dettagli sulla certificazione di Informatica, puoi controllare il nostro blog Certificazione Informatica: tutto quello che c'è da sapere .

Se hai già deciso di intraprendere una carriera in Informatica, ti consiglierei perché non dai un'occhiata al nostro pagina del corso. La formazione sulla certificazione di Informatica presso Edureka ti renderà un esperto in Informatica attraverso sessioni dal vivo con istruttore e formazione pratica utilizzando casi d'uso reali.