Come eseguire gli script Hive?



Questo è un tutorial su come eseguire gli script Hive. L'esecuzione di questo script ridurrà il tempo e lo sforzo che dedichiamo alla scrittura e all'esecuzione manuale di ogni comando.

Essendo un pacchetto di data warehouse basato su Hadoop, Apache Hive viene sempre più utilizzato per l'analisi dei dati, il data mining e la modellazione predittiva. Le organizzazioni cercano professionisti con una presa salda . In questo post, vediamo come eseguire gli script Hive. In generale, utilizziamo gli script per eseguire una serie di istruzioni contemporaneamente. Gli script Hive vengono utilizzati più o meno allo stesso modo. Ridurrà il tempo e lo sforzo che dedichiamo alla scrittura e all'esecuzione manuale di ogni comando.

Gli script Hive sono supportati in Hive 0.10.0 e versioni successive. Poiché la versione Hive 0.90 è installata in CDH3, non possiamo eseguire Hive Scripts in CDH3. Puoi provare i seguenti passaggi in CDH4 poiché ha la versione Hive 0.10.0 installata al loro interno. Sei a conoscenza di come creare uno script Hive? In caso negativo, fare clic su per ottenere maggiori chiarimenti.





Master-Hive-Now

Vediamo ora come scrivere gli script in Hive ed eseguirli in CDH4:



Passaggio 1: scrittura di uno script Hive.

Per scrivere lo script Hive il file deve essere salvato con estensione .sql. Apri un terminale nella tua distribuzione Cloudera CDH4 e dai il seguente comando per creare uno script Hive.
Comando: sudo gedit sample.sql

differenza tra jquery e javascript

Eseguendo il comando precedente, si aprirà il file con l'elenco di tutti i comandi Hive che devono essere eseguiti.



In questo script, verrà creata, descritta una tabella e i dati verranno caricati e recuperati dalla tabella.

1. Creazione della tabella in Hive:

Comando: crea tabella prodotto (productid: int, productname: string, price: float, category: string) righe formato campi delimitati terminati da ','

Qui, prodotto è il nome della tabella e {productid, productname, price, category} sono le colonne di questa tabella.

I campi che terminano con ',' indicano che le colonne nel file di input sono separate dal simbolo ','.

Per impostazione predefinita, i record nel file di input sono separati da una nuova riga.

2. Descrizione della tabella:

Comando: descrivere il prodotto

ruoli e responsabilità dell'amministratore hadoop

3. Caricamento dei dati nella tabella.

Per caricare i dati nella tabella dobbiamo prima creare un file di input che contenga i record che devono essere inseriti nella tabella.

Creiamo un file di input.

Comando: sudo gedit input.txt

Modificare il contenuto nel file come mostrato in figura.

4. Recupero dei dati:

Per recuperare i dati, viene utilizzato il comando select.

Comando: Seleziona * dal prodotto

Il comando precedente serve per recuperare il valore di tutte le colonne presenti nella tabella. Lo script dovrebbe essere come mostrato nell'immagine sottostante.

Ora abbiamo finito di scrivere la sceneggiatura di Hive. Il file sample.sql può ora essere salvato.

Passaggio 2: esecuzione dello script Hive

Di seguito è riportato il comando per eseguire lo script Hive:

Comando: hive –f /home/cloudera/sample.sql

Durante l'esecuzione dello script, assicurarsi che sia presente l'intero percorso della posizione del file Script.

sequenza di fibonacci in c ++

Possiamo vedere che tutti i comandi vengono eseguiti con successo.

Questo è il modo in cui gli script Hive vengono eseguiti ed eseguiti in CDH4.

Hive è un componente fondamentale di Hadoop e la tua esperienza in Hive può farti ottenere lavori Hadoop più remunerativi! Edureka ha un corso Hadoop appositamente curato che ti aiuta a padroneggiare concetti come MapReduce, Yarn, Pig, Hive, HBase, Oozie, Flume e Sqoop. Fare clic sul pulsante in basso per iniziare.

Hai domande per noi? Per favore menzionali nella sezione commenti e ti risponderemo.

Post correlati:

Comandi Hive

Modelli di dati Hive