Tutorial HBase: Introduzione a HBase e case study su Facebook
Questo blog tutorial HBase ti introduce a cos'è HBase e alle sue caratteristiche. Copre anche il caso di studio di Facebook Messenger per comprendere i vantaggi di HBase.
Questo blog tutorial HBase ti introduce a cos'è HBase e alle sue caratteristiche. Copre anche il caso di studio di Facebook Messenger per comprendere i vantaggi di HBase.
Questo blog è una guida su come installare Puppet Master e Puppet Agent. Include anche un esempio per distribuire Apache Tomcat utilizzando Puppet Tomcat Module.
Questo blog è una guida passo passo per l'installazione di Apache Pig in ambiente Linux. Installeremo Apache Pig 0.16.0 e lo eseguiremo in diverse modalità.
Questo blog sull'architettura HBase spiega il modello di dati HBase e fornisce informazioni sull'architettura HBase. Spiega anche diversi meccanismi in HBase.
Questo blog tutorial di Hive offre una conoscenza approfondita dell'architettura Hive e del modello di dati Hive. Spiega anche il caso studio della NASA su Apache Hive.
Questo blog di Spark Streaming ti introdurrà a Spark Streaming, alle sue funzionalità e componenti. Include un progetto di analisi del sentimento utilizzando Twitter.
Questo blog Spark MLlib ti introdurrà alla libreria di Machine Learning di Apache Spark. Include un progetto del sistema di raccomandazione dei film che utilizza Spark MLlib.
Questo blog tutorial di GraphX ti introdurrà ad Apache Spark GraphX, alle sue caratteristiche e ai suoi componenti, incluso un progetto di analisi dei dati di volo.
Questo blog tutorial di Apache Flume spiega i fondamenti di Apache Flume e le sue caratteristiche. Mostrerà anche lo streaming di Twitter utilizzando Apache Flume.
Esercitazione su Apache Sqoop: Sqoop è uno strumento per il trasferimento di dati tra database Hadoop e relazionali. Questo blog copre l'importazione e l'esportazione di Sooop da MySQL.
Apache Oozie Tutorial: Oozie è un sistema di pianificazione del flusso di lavoro per gestire i lavori Hadoop. È un sistema scalabile, affidabile ed estensibile.
Le applicazioni Big Data stanno rivoluzionando le organizzazioni e aiutandole a prendere decisioni di business più informative analizzando grandi volumi di dati.
Apache Spark ha assunto il controllo del mondo dei Big Data e dell'analisi e Python è uno dei linguaggi di programmazione più accessibili utilizzati oggi nel settore. Quindi qui in questo blog, impareremo a conoscere Pyspark (scintilla con Python) per ottenere il meglio da entrambi i mondi.
Questo blog si concentra su Apache Hadoop YARN che è stato introdotto in Hadoop versione 2.0 per la gestione delle risorse e la pianificazione dei lavori. Spiega l'architettura YARN con i suoi componenti e le mansioni svolte da ciascuno di essi. Descrive l'invio della domanda e il flusso di lavoro in Apache Hadoop YARN.
In questo blog sul tutorial di PySpark, imparerai a conoscere l'API PSpark che viene utilizzata per lavorare con Apache Spark utilizzando il linguaggio di programmazione Python.
In questo blog tutorial di PySpark Dataframe, imparerai le trasformazioni e le azioni in Apache Spark con più esempi.
Questo blog Edureka su Cloudera Hadoop Tutorial ti fornirà una panoramica completa dei diversi componenti di Cloudera come Cloudera Manager, Parcels, Hue ecc.
Questo post descrive l'aumento della domanda di competenze Hadoop e NoSQL nell'IT e in altri campi. continua a leggere per vedere come le competenze Hadoop e NoSQL aiuteranno
Questo blog discute i vantaggi dell'implementazione di Hadoop, delle iniziative Hadoop, di Hadoop nelle piccole e grandi organizzazioni e dei vantaggi per la carriera della formazione Hadoop.
Hadoop è diventata una competenza fondamentale da acquisire nel circuito IT, il numero di profili degli studenti Hadoop sta aumentando drasticamente di giorno in giorno.