Big Data

Tutorial HBase: Introduzione a HBase e case study su Facebook

Questo blog tutorial HBase ti introduce a cos'è HBase e alle sue caratteristiche. Copre anche il caso di studio di Facebook Messenger per comprendere i vantaggi di HBase.

Installa Puppet: installa Puppet in quattro semplici passaggi

Questo blog è una guida su come installare Puppet Master e Puppet Agent. Include anche un esempio per distribuire Apache Tomcat utilizzando Puppet Tomcat Module.

Installazione di Apache Pig su Linux

Questo blog è una guida passo passo per l'installazione di Apache Pig in ambiente Linux. Installeremo Apache Pig 0.16.0 e lo eseguiremo in diverse modalità.

Architettura HBase: modello dati HBase e meccanismo di lettura / scrittura HBase

Questo blog sull'architettura HBase spiega il modello di dati HBase e fornisce informazioni sull'architettura HBase. Spiega anche diversi meccanismi in HBase.

Hive Tutorial - Hive Architecture e NASA Case Study

Questo blog tutorial di Hive offre una conoscenza approfondita dell'architettura Hive e del modello di dati Hive. Spiega anche il caso studio della NASA su Apache Hive.

Esercitazione sullo streaming di Spark - Analisi del sentiment con Apache Spark

Questo blog di Spark Streaming ti introdurrà a Spark Streaming, alle sue funzionalità e componenti. Include un progetto di analisi del sentimento utilizzando Twitter.

Spark MLlib - Libreria di machine learning di Apache Spark

Questo blog Spark MLlib ti introdurrà alla libreria di Machine Learning di Apache Spark. Include un progetto del sistema di raccomandazione dei film che utilizza Spark MLlib.

Esercitazione su Spark GraphX - Analisi del grafico in Apache Spark

Questo blog tutorial di GraphX ti introdurrà ad Apache Spark GraphX, alle sue caratteristiche e ai suoi componenti, incluso un progetto di analisi dei dati di volo.

Esercitazione su Apache Flume: streaming di dati su Twitter

Questo blog tutorial di Apache Flume spiega i fondamenti di Apache Flume e le sue caratteristiche. Mostrerà anche lo streaming di Twitter utilizzando Apache Flume.

Esercitazione su Apache Sqoop: importazione / esportazione di dati tra HDFS e RDBMS

Esercitazione su Apache Sqoop: Sqoop è uno strumento per il trasferimento di dati tra database Hadoop e relazionali. Questo blog copre l'importazione e l'esportazione di Sooop da MySQL.

Tutorial Oozie: scopri come programmare i tuoi lavori Hadoop

Apache Oozie Tutorial: Oozie è un sistema di pianificazione del flusso di lavoro per gestire i lavori Hadoop. È un sistema scalabile, affidabile ed estensibile.

Applicazioni Big Data in tempo reale in vari domini

Le applicazioni Big Data stanno rivoluzionando le organizzazioni e aiutandole a prendere decisioni di business più informative analizzando grandi volumi di dati.

Introduzione a Spark con Python - PySpark per principianti

Apache Spark ha assunto il controllo del mondo dei Big Data e dell'analisi e Python è uno dei linguaggi di programmazione più accessibili utilizzati oggi nel settore. Quindi qui in questo blog, impareremo a conoscere Pyspark (scintilla con Python) per ottenere il meglio da entrambi i mondi.

Hadoop YARN Tutorial - Impara i fondamenti dell'architettura YARN

Questo blog si concentra su Apache Hadoop YARN che è stato introdotto in Hadoop versione 2.0 per la gestione delle risorse e la pianificazione dei lavori. Spiega l'architettura YARN con i suoi componenti e le mansioni svolte da ciascuno di essi. Descrive l'invio della domanda e il flusso di lavoro in Apache Hadoop YARN.

Articoli Più

Categoria

Articoli Interessanti