OLTP contro OLAP
Si dice che OLTP sia più un sistema transazionale online o un sistema di archiviazione dati, in cui l'utente esegue molte transazioni online utilizzando l'archivio dati. Si dice anche che abbia più letture / scritture ad-hoc in tempo reale.
OLAP è più un archivio dati offline. Vi si accedenumero di voltein modalità offline. Ad esempio, i file di registro in blocco vengono letti e quindi riscritti nei file di dati. Alcune delle aree comuni in cui viene utilizzato OLAP sono Log Jobs, Data mining Jobs, ecc.
Si dice che Cassandra sia più OLTP, in quanto è in tempo reale, mentre Hadoop è più OLAP, poiché viene utilizzato per analisi e scritture in blocco.
cos'è questo operatore in java
Perché integrare OLAP e OLTP?
Se nel caso in cui stai cercando il prezzo più basso per la prenotazione di hotel nei prossimi 365 giorni, qui hai un enorme set di dati per Cassandra e vuoi avere consigli su database in tempo reale, viene eseguita una promozione in base al prezzo.
In uno scenario del genere, dobbiamo iterare tutti i record e mantenere le analisi su di esso, il che è un enorme lavoro offline che deve essere avviato spesso. Qui, Hadoop entra in gioco per lo scricchiolio di dati in blocco.
L'altro vantaggio è che possiamo eseguire un cluster e interrompere l'esecuzione di un cluster Hadoop diverso.
trasforma la stringa in un array php
Il terzo vantaggio è che si possono anche ridurre molti costi operativi.
Dato uno scenario, in cui, se un utente è esperto in vari ecosistemi Hadoop, come Hive, Pig Latin e ha bisogno di integrare i dati in esso, è necessario collegare una fonte di dati in Cassandra e provare a eseguire Map Riduci anche i posti di lavoro.
C'è uno schema evidente tra OLTP e OLAP. In OLTP, il numero di scritture è inferiore, ad es. Informazioni sull'albergo. Supponendo che le variazioni di prezzo avvengano ogni 5000 volte al secondo, le letture potrebbero essere maggiori qui. In tale scenario, può esserci 1 scrittura al secondo, ma le letture potrebbero essere espulse a centinaia e migliaia. Quindi il rapporto qui è di circa 1: 1000.
È un'osservazione interessante che Cassandra può adattarsi facilmente a questo modello, che include modelli, in cui lettura / scrittura è uguale. Inoltre, quando si tratta di OLTP, anche se si entra in un modello di consistenza sintonizzabile e forte, si può vedere un divario di millisecondi tra i modelli coerenti finali e i modelli coerenti più forti. Pertanto, Cassandra può adattarsi a OLTP.
Venendo a OLAP, si possono vedere diversi modelli OLAP, il che significa che ci sono diverse scritture che avvengono simultaneamente. In OLAP, eseguiamo il dump dei dati in una sola volta, ovvero tutti i file di registro vengono inseriti nell'archivio dati e quindi iniziamo l'elaborazione. Il modello di dati o il modello di accesso è esattamente l'opposto del tipo di applicazione OLTP. Qui saranno utili Hadoop o MapReduce.
pmi-acp ne vale la pena
Hai domande per noi? Menzionateli nella sezione commenti e vi risponderemo.
Post correlati:
I 5 principali motivi per imparare Cassandra