Tutorial R - Una guida per principianti per imparare la programmazione R



Questo blog su R Tutorial ti introduce allo strumento R e ti aiuta a comprendere i vari fondamenti della programmazione R in dettaglio con esempi.

R è lo strumento di analisi dei dati più popolare in quanto è open source, flessibile, offre più pacchetti e ha una vasta comunità. È progettato per programmatori di software, statistici e data miner, allo stesso modo e, quindi, ha dato origine alla popolarità di .In questo blog Tutorial R, ti darò una visione completa di R con esempi.

Di seguito sono riportati gli argomenti in questo blog R Tutorial di cui parlerò nella sequenza seguente:





  1. Perché abbiamo bisogno di Analytics ?
  2. Cos'è l'analisi aziendale ?
  3. Perché R e Chi usa R ?
  4. Installazione di R
  5. Operatori di dati
  6. Tipi di dati
  7. Controllo del flusso

Tutorial R: Perché abbiamo bisogno dell'analisi?

Prima di rispondere alla domanda, permettimi di illustrarti alcuni dei problemi e le loro soluzioni in R in più domini.



banking - Tutorial R - Edureka

Bancario :

Ogni giorno nelle banche viene generata una grande quantità di dati sui clienti. WMentre si tratta regolarmente con milioni di clienti, diventa difficile tenere traccia dei loro mutui.



Soluzione :

R costruisce un modello personalizzato che mantiene i prestiti erogati ad ogni singolo cliente che ci aiuta a decidere l'importo da pagare dal cliente nel tempo.

Assicurazione :

L'assicurazione dipende ampiamente dalle previsioni. È difficiledecidere quale politica accettare o rifiutare.

Soluzione:

Utilizzando il rapporto di credito continuo come input, possiamo creare un modello in R che non solo valuterà la propensione al rischio, ma farà anche una previsione predittiva.

Assistenza sanitaria:

Ogni anno milioni di persone vengono ricoverate in ospedale e miliardi vengono spesi ogni anno solo nel processo di ammissione.

Soluzione :

Data l'anamnesi del paziente e la storia medica, è possibile costruire un modello predittivo per identificare chi è a rischio di ricovero e in che misura l'attrezzatura medica deve essere ridimensionata.

Ora sappiamo come l'analisi dei dati aiuta le organizzazioni a sfruttare i propri dati e utilizzarli per identificare nuove opportunità. Se parliamo della necessità di analisi in un'organizzazione, devi incontrare questi 4 aspetti:

Successivamente, andiamo avanti nel blog tutorial R, dove prima capiremo cos'è esattamente l'analisi aziendale.

Tutorial R: che cos'è l'analisi aziendale?

L'analisi aziendale è un processo di esame di grandi set di dati e raggiungimento di modelli nascosti, correlazioni e altre informazioni. Fondamentalmente ti aiuta a capire tutti i dati che hai raccolto, che si tratti di dati organizzativi, dati di ricerche di mercato o di prodotto o qualsiasi altro tipo di dati. Diventa facile per te prendere decisioni migliori, prodotti migliori, strategie di marketing migliori, ecc. Fai riferimento all'immagine sottostante per una migliore comprensione:

Se guardi la figura sopra, i tuoi dati nella prima immagine sono sparsi. Ora, se vuoi qualcosa di specifico come un particolare record in un database, diventa ingombrante. Per semplificare questo, hai bisogno di analisi. Con l'analisi diventa facile stabilire una correlazione tra i dati. Una volta stabilito cosa fare, diventa abbastanza facile per te prendere decisioni come, quale percorso vuoi seguire o in termini di business analytics, quale percorso porterà al miglioramento della tua organizzazione.

Ma non puoi aspettarti che le persone nella catena di cui sopra comprendano sempre i dati grezzi che fornisci loro dopo l'analisi. Quindi, per superare questo divario, abbiamo un concetto di visualizzazione dati .

Visualizzazione dati : La visualizzazione dei dati è un accesso visivo a enormi quantità di dati che hai generato dopo l'analisi. La mente umana elabora le immagini visive e la grafica visiva è migliore del confronto con i dati grezzi. È sempre facile per noi capire un grafico a torta o un grafico a barre rispetto a numeri grezzi. Ora ti starai chiedendo come puoi ottenere questa visualizzazione dei dati dai dati che hai già analizzato?
Esistono vari strumenti disponibili sul mercato per la visualizzazione dei dati:

Vi starete tutti chiedendo che ci siano già così tanti strumenti che vi aiutano a ottenere la visualizzazione dei dati e una certa quantità di analisi, perché andare con R?

Quindi il mio prossimo argomento nel blog tutorial R tratta del 'perché R' e di 'chi usa R'.

Tutorial R: Perché R e chi usa R?

Perché R?

R è un linguaggio di programmazione e statistica.

R è utilizzato per l'analisi e la visualizzazione dei dati.

R è semplice e facile da imparare, leggere e scrivere.

R è un esempio di FLOSS (Free Libre and Open Source Software) dove si possono distribuire liberamente copie di questo software, leggere il suo codice sorgente, modificarlo, ecc.

Chi usa R?

  • Il Consumer Financial Protection Bureau utilizza R per l'analisi dei dati
  • Gli statistici di John Deere utilizzano R per la modellazione di serie temporali e l'analisi geospaziale in modo affidabile e riproducibile.
  • Bank of America utilizza R per i rapporti.
  • R fa parte dello stack tecnologico dietro il famoso motore di raccomandazione di Foursquare.
  • ANZ, la quarta banca più grande in Australia, utilizza R per l'analisi del rischio di credito.
  • Google utilizza R per prevedere l'attività economica.
  • Mozilla, la fondazione responsabile del browser Web Firefox, utilizza R per visualizzare l'attività Web.

Di seguito sono riportati alcuni dei domini in cui viene utilizzato R:

Ora, andiamo avanti nel blog tutorial R e installiamo R.

Tutorial R: installazione di R

Lascia che ti guidi attraverso il processo di installazione di R sul tuo sistema. Segui i passaggi seguenti:

Passo 1 : Vai al link- https://cran.r-project.org/

Passo 2 : Scarica e installa R 3.3.3 sul tuo sistema.

Fare riferimento allo screenshot qui sotto per ottenere una migliore comprensione.

Seguendo i passaggi precedenti, hai finito con la parte di installazione R. Ora puoi avviare direttamente la codifica in R scaricando RStudio IDE. Per scaricarlo, segui i passaggi seguenti:

Passo 1 : Vai al link- https://www.rstudio.com/

Passo 2 : Scarica e installa Rstudio sul tuo sistema.

Dopo aver installato tutto, sei pronto per il codice!

trasforma la stringa in un array php

R Tutorial per principianti | Tutorial di programmazione R | Edureka

Successivamente, andiamo avanti nel blog R Tutorial e comprendiamo cosa sono gli operatori di dati in R.

Tutorial R: Operatori dati in R

Esistono principalmente 5 diversi tipi di operatori, elencati di seguito:

  1. Operatori aritmetici : Esegue operazioni aritmetiche come addizione, sottrazione, moltiplicazione, divisione ecc.
  2. Operatori di assegnazione :Gli operatori di assegnazione vengono utilizzati per assegnare i valori. Per esempio:
  • Operatore di assegnazione =
    Sintassi:
    nome variabile = valore
> x = 5 >X 
Uscita: [1] 5
  • Operatore di assegnazione<-
    Sintassi:
    nome della variabile<- value

    > x<- 15 > x
    Uscita: [1] 15
  • Operatore di assegnazione<<-
    Sintassi:
    nome della variabile<<- value
> x<<- 2 > x
Uscita: [1] 2
  • Operatore di assegnazione ->
    Sintassi:
    valore -> nome della variabile

    > 25 -> x > x 
    Uscita: [1] 25

3. Operatore relazionale : Definisce una relazione tra due entità. Per esempio: ,<=,!= etc.

> xx! = 2
Produzione:[1] VERO

4. Operatori logici : Questi operatori confrontano le due entità e sono generalmente utilizzati con valori booleani (logici) come &, | e !.

> x2 e 3
Produzione:[1] VERO

5. Operatori speciali : Questi operatori vengono utilizzati per scopi specifici, non per il calcolo logico. Per esempio:

  • Crea la serie di numeri in sequenza per un vettore.

    > xx
    Uscita: [1] 2 3 4 5 6 7 8
  • % in% Questo operatore viene utilizzato per identificare se un elemento appartiene a un vettore.
    Esempio

    > xyy% in% x
    Uscita: [1] TRUE

Tutorial R: tipi di dati

I tipi di dati vengono utilizzati per memorizzare le informazioni. In R, non è necessario dichiarare una variabile come un tipo di dati. Le variabili vengono assegnate con R-Objects e il tipo di dati dell'oggetto R diventa il tipo di dati della variabile.Ci sono principalmente sei tipi di dati presenti in R:

Andiamo più in dettaglio su ciascuno di essi:

Vettore : Un vettore è una sequenza di elementi di dati dello stesso tipo di base. Esempio:

vtr = (1, 3, 5 ,7 9)

o

vtr<- (1, 3, 5 ,7 9)

Esistono 5 vettori atomici, definiti anche cinque classi di vettori.

Elenco : Le liste sono gli oggetti R che contengono elementi di diverso tipo come & meno numeri, stringhe, vettori e un altro elenco al suo interno.

> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = list (n, s, TRUE) > x

Produzione -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee' [[3]] [1] TRUE

Array : Gli array sono gli oggetti dati R che possono memorizzare dati in più di due dimensioni. Prende i vettori come input e utilizza i valori nel parametro dim per creare un array.

vettore1<- c(5,9,3) vettore2<- c(10,11,12,13,14,15) risultato<- array(c(vector1,vector2),dim = c(3,3,2))

Produzione -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Array : Le matrici sono gli oggetti R in cui gli elementi sono disposti in un layout rettangolare bidimensionale. Una matrice viene creata utilizzando la funzione matrix (). Esempio: matrice (data, nrow, ncol, byrow, dimnames) dove,

dati è il vettore di input che diventa l'elemento dati della matrice.

nrow è il numero di righe da creare.

ncol è il numero di colonne da creare.

byrow è un indizio logico. Se TRUE, gli elementi del vettore di input sono disposti per riga.

dimname sono i nomi assegnati alle righe e alle colonne.

> Mat<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Mat
Produzione :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Fattori : I fattori sono gli oggetti dati utilizzati per classificare i dati e archiviarli come livelli. Possono memorizzare sia stringhe che numeri interi. Sono utili nell'analisi dei dati per la modellazione statistica.

> dati<- c('East','West','East','North','North','East','West','West“,'East“) > factor_data<- factor(data) > factor_data

Produzione :

[1] Est Ovest Est Nord Nord Est Ovest Ovest Est Livelli: Est Nord Ovest

Frame di dati : Un data frame è una tabella o una struttura a matrice bidimensionale in cui ogni colonna contiene i valori di una variabile e ogni riga contiene un insieme di valori da ogni colonna.

> std_id = c (1: 5) > nome_std = c ('Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > punti = c (623.3,515.2,611.0,729.0,843.25) > dati std<- data.frame(std_id, std_name, marks) > dati std

Produzione :

std_id nome_std contrassegni 1 1 Rick 623.30 2 2 e 515.20 3 3 Michelle 611.00 4 4 Ryan 729.00 5 5 Gary 843.25

Con questo, arriviamo alla fine dei diversi tipi di dati in R. Successivamente, andiamo avanti nel blog R Tutorial e comprendiamo un altro concetto chiave: le istruzioni di controllo del flusso.

Tutorial R: istruzioni di controllo del flusso

Le istruzioni di controllo del flusso svolgono un ruolo molto importante in quanto consentono di controllare il flusso di esecuzione di uno script all'interno di una funzione. Le istruzioni di controllo del flusso più comunemente utilizzate sono rappresentate nell'immagine seguente:

Ora, esaminiamo ciascuno di essi con esempi.

Tutorial R: istruzioni del selettore

  • If dichiarazione di controllo : Questa istruzione di controllo valuta una singola condizione. È abbastanza semplice in quanto ha solo una singola parola chiave 'if' seguita dalla condizione e quindi un certo insieme di istruzioni che devono essere eseguite nel caso in cui sia vero. Fare riferimento al diagramma di flusso seguente per una migliore comprensione:

In questo diagramma di flusso, il codice risponderà nel modo seguente:

  1. Prima di tutto, entrerà nel ciclo in cui verifica la condizione.
  2. Se la condizione è vera, verrà eseguito il codice condizionale o le istruzioni scritte.
  3. Se la condizione è falsa, le istruzioni vengono ignorate.

Di seguito è riportato un esempio di Se istruzione di controllo in R. Prova a eseguire questo esempio in R Studio.

x = 2 ripetizione {x = x ^ 2 print (x) if (x> 100) {break}

Produzione :

[1] 4 [1] 16 [1] 256
  • If Else Control Statement :Esametipo di dichiarazione di controllovaluta un gruppo di condizioni e seleziona le istruzioni. Fare riferimento al diagramma di flusso seguente per una migliore comprensione:

In questo diagramma di flusso, il codice risponderà nel modo seguente:

  1. Prima di tutto, entrerà nel ciclo in cui verifica la condizione.
  2. Se la condizione è vera, verranno eseguite le prime istruzioni 'if'.
  3. Se la condizione è falsa, passa alla condizione 'else if' e se è vera, verrà eseguito il codice 'else if'.
  4. Infine, se anche il codice 'else if' è falso, andrà al codice 'else' e verrà eseguito. Ciò significa che se nessuna di queste condizioni è vera, viene eseguita l'istruzione 'else'.

Di seguito è riportato un esempio di se altro istruzione di controllo in R. Prova a eseguire questo esempio in R Studio.

x5) {print ('x è maggiore di 5')} elseif (x == 5) {print ('x è uguale a 5')} else {print ('x non è maggiore di 5')}

Produzione:

[1] 'x è uguale a 5'
  • Cambia dichiarazioni : Queste istruzioni di controllo sono fondamentalmente utilizzate per confrontare una certa espressione con un valore noto. Fare riferimento al diagramma di flusso seguente per una migliore comprensione:

In questo diagramma di flusso del caso Switch, il codice risponderà nei seguenti passaggi:

  1. Prima di tutto entrerà nel caso switch che ha un'espressione.
  2. Successivamente andrà alla condizione del caso 1, controlla il valore passato alla condizione. Se è vero, verrà eseguito il blocco di istruzioni. Dopodiché, si romperà da quella custodia dell'interruttore.
  3. Nel caso in cui sia falso, passerà al caso successivo. Se la condizione del caso 2 è vera, eseguirà l'istruzione e si interromperà da quel caso, altrimenti salterà di nuovo al caso successivo.
  4. Supponiamo ora che tu non abbia specificato alcun caso o che ci sia un input errato da parte dell'utente, quindi andrà al caso predefinito dove stamperà la tua dichiarazione predefinita.

Di seguito è riportato un esempio di istruzione switch in R. Prova a eseguire questo esempio in R Studio.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Produzione :

[1] 275

Tutorial R: istruzioni in loop

I loop ti aiutano a ripetere determinati set di azioni in modo da non doverle eseguire ripetutamente. Immagina di dover eseguire un'operazione 10 volte, se inizi a scrivere il codice ogni volta, la lunghezza del programma aumenta e ti sarebbe difficile comprenderlo in seguito. Ma allo stesso tempo, utilizzando un ciclo, se scrivo la stessa istruzione all'interno di un ciclo, si risparmia tempo e si rende più facile la leggibilità del codice. Inoltre è più ottimizzato rispetto all'efficienza del codice.

Nell'immagine sopra, ' ripetere' e ' mentre 'Le istruzioni ti aiutano a eseguire un certo insieme di regole finché la condizione non è vera ma' per' è un'istruzione di ciclo che viene utilizzata quando si sa quante volte si desidera ripetere un blocco di istruzioni. Ora, se sai che vuoi ripeterlo per 10 volte, allora andrai con l'istruzione 'for' ma se non sei sicuro di quante volte vuoi che il codice venga ripetuto, andrai con 'repeat' o ciclo 'while'.

Discutiamo ognuno di loro con esempi.

  • Ripetere : Il ciclo di ripetizione aiuta a eseguire lo stesso set di codice ancora e ancora fino a quando non viene soddisfatta una condizione di arresto. Fare riferimento al diagramma di flusso seguente per una migliore comprensione:

Nel diagramma di flusso precedente, il codice risponderà nei seguenti passaggi:

  1. Prima di tutto entrerà ed eseguirà una serie di codice.
  2. Successivamente controllerà la condizione, se è vera tornerà indietro ed eseguirà di nuovo lo stesso set di codice finché non sarà falso.
  3. Se viene trovato falso, uscirà direttamente dal ciclo.
  • Mentre : L'istruzione while aiuta anche a eseguire lo stesso insieme di codice più e più volte fino a quando non viene soddisfatta una condizione di arresto. Fare riferimento al diagramma di flusso seguente per una migliore comprensione:

Nel diagramma di flusso precedente, il codice risponderà nei seguenti passaggi:

  1. Prima di tutto controllerà le condizioni.
  2. Se viene trovato vero, eseguirà il set di codice.
  3. Successivamente, controlla nuovamente la condizione, se è vera eseguirà di nuovo lo stesso codice. Non appena la condizione risulta essere falsa, esce immediatamente dal ciclo.

Di seguito è riportato un esempio di istruzione while in R. Prova a eseguire questo esempio in R Studio.

x = 2 mentre (x<1000) { x=x^2 print(x) } 

Produzione:

4 16 256 65 536

Quindi ti starai chiedendo come differiscono queste due affermazioni? Lasciami chiarire il tuo dubbio!
Qui la principale differenza tra la ripetizione e la dichiarazione while è che cambia rispetto alla tua condizione. Mentre loop fondamentalmente definisce quando si accederà al ciclo per eseguire le istruzioni e ripetere loop definisce quando si esce dal ciclo dopo l'esecuzione delle istruzioni. Quindi queste due istruzioni sono note come loop di controllo di ingresso e loop di controllo di uscita. Ecco come le dichiarazioni while e repeat sono diverse.

  • Per Loop: I cicli For vengono utilizzati quando è necessario eseguire un blocco di codice più volte. Fare riferimento al diagramma di flusso seguente per una migliore comprensione:

Nel diagramma di flusso precedente, il codice risponderà nei seguenti passaggi:

  1. Prima di tutto c'è l'inizializzazione in cui specifichi quante volte vuoi che il ciclo si ripeta.
  2. Successivamente, controlla le condizioni. Se la condizione è vera, eseguirà il set di codice per il numero di volte specificato.
  3. Non appena la condizione risulta essere falsa, esce immediatamente dal ciclo.

Di seguito è riportato un esempio di istruzione for in R. Prova a eseguire questo esempio in R Studio.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Produzione :

7 19 25 65 45

Successivamente, passiamo alla nostra ultima serie di istruzioni nel blog R Tutorial, ovvero le istruzioni jump.

Tutorial R: istruzioni Jump

Istruzione Break : Le istruzioni Break aiutano a terminare il programma e riprende il controllo all'istruzione successiva che segue il ciclo. Queste istruzioni vengono utilizzate anche in caso di switch. Fare riferimento al diagramma di flusso seguente per una migliore comprensione:

Nel diagramma di flusso precedente, il codice risponderà nei seguenti passaggi:

  1. Prima di tutto, entrerà nel ciclo in cui verifica la condizione.
  2. Se la condizione del ciclo è falsa, esce direttamente dal ciclo.
  3. Se la condizione è vera, controllerà la condizione di interruzione.
  4. Se la condizione di interruzione è vera, esiste dal ciclo.
  5. Se la condizione di interruzione è falsa, eseguirà le istruzioni che rimangono nel ciclo e quindi ripeterà gli stessi passaggi.

Di seguito è riportato un esempio di istruzione jump in R. Prova a eseguire questo esempio in R Studio.

X<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Produzione:

[1] 1 [1] 2

Istruzione successiva : Un'istruzione successiva viene utilizzata quando si desidera saltare l'iterazione corrente del ciclo senza terminarlo. L'istruzione Next è abbastanza simile a 'continue' in un altro linguaggio di programmazione. Fare riferimento al diagramma di flusso seguente per una migliore comprensione:

Nel diagramma di flusso precedente, il codice risponderà nei seguenti passaggi:

  1. Prima di tutto, entrerà nel ciclo in cui verifica la condizione.

  2. Se la condizione del ciclo è falsa, esce direttamente dal ciclo.

  3. Se la condizione del ciclo è vera, eseguirà le istruzioni del blocco 1.

  4. Dopodiché verificherà la presenza dell'istruzione 'successiva'. Se è presente, le istruzioni successive non verranno eseguite nella stessa iterazione del ciclo.

  5. Se l'istruzione 'next' non è presente, verranno eseguite tutte le istruzioni successive.

Di seguito è riportato un esempio dell'istruzione successiva in R. Prova a eseguire questo esempio in R Studio.

for (i in 1:15) {if ((i %% 2) == 0) {next} print (i)}

Produzione :

1 3 5 7 9 11 13 15

Questa è la fine del blog tutorial R. Spero che voi ragazzi siate chiari su ogni concetto di cui ho discusso sopra. Restate sintonizzati, il mio prossimo blog sarà sulla formazione R dove spiegherò in dettaglio alcuni concetti di R in più con exampio.

Ora che hai compreso le basi di R, controlla il file da Edureka, una società di formazione online affidabile con una rete di oltre 250.000 studenti soddisfatti sparsi in tutto il mondo. La formazione di Data Analytics con R di Edureka ti aiuterà ad acquisire esperienza in programmazione R, manipolazione dei dati, analisi esplorativa dei dati, visualizzazione dei dati, data mining, regressione, analisi del sentiment e utilizzo di R Studio per casi di studio reali su vendita al dettaglio, social media.

Hai domande per noi? Per favore, menzionalo nella sezione commenti di questo blog 'R Tutorial' e ti risponderemo il prima possibile.