Programmazione R - Guida per principianti al linguaggio di programmazione R.



Questo blog sulla programmazione R ti introduce a R e ti aiuta a comprendere i vari concetti fondamentali della programmazione R in dettaglio con esempi.

R è uno degli strumenti di analisi più popolari. Ma oltre ad essere utilizzato per l'analisi, R è anche un linguaggio di programmazione.Con la sua crescita nel settore IT, c'è una crescente domanda di esperti o con una comprensione di R sia come strumento di analisi dei dati che come linguaggio di programmazione.In questo blog, ti aiuterò a capire i vari fondamenti della programmazione R. Nel nostro p revious Blog ,abbiamo discusso Perché abbiamo bisogno di Analytics, Cos'è Business Analytics, Perché e Chi usa R.

In questo blog, comprenderemo i seguenti concetti fondamentali della programmazione R nella sequenza seguente:





  1. Variabili
  2. Tipi di dati
  3. Operatori di dati
  4. Dichiarazione condizionale
  5. Loop
  6. Funzioni

Puoi seguire la registrazione del webinar del linguaggio di programmazione R in cui il nostro istruttore ha spiegato gli argomenti in modo dettagliato con esempi che ti aiuteranno a comprendere meglio la programmazione R.

Programmazione R per principianti | Tutorial sul linguaggio di programmazione R | Edureka



Quindi andiamo avanti e guardiamo al primo concetto di Programmazione R - Variabili.

Programmazione R: variabili

Le variabili non sono altro che un nome a una posizione di memoria contenente un valore. Una variabile in R può memorizzare valori numerici, valori complessi, parole, matrici e persino una tabella. Sorprendente, vero?

Variabile - Programmazione R - Edureka

Figura: Creazionedi variabili



L'immagine sopra ci mostra come vengono create le variabili e come vengono memorizzate in diversi blocchi di memoria. In R, non dobbiamo dichiarare una variabile prima di usarla, a differenza di altri linguaggi di programmazione come Java, C, C ++, ecc.

Andiamo avanti e proviamo a capire cos'è un tipo di dati e i vari tipi di dati supportati in R.

Programmazione R: tipi di dati

In R, una variabile stessa non è dichiarata di alcun tipo di dati, piuttosto ottiene il tipo di dati dell'oggetto R assegnato ad essa. Quindi R è chiamato linguaggio tipizzato dinamicamente, il che significa che possiamo cambiare un tipo di dati della stessa variabile ancora e ancora quando lo usiamo in un programma.

Tipi di dati specifica il tipo di valore di una variabile e il tipo di operazioni matematiche, relazionali o logiche che possono essere applicate senza causare errori. Esistono molti tipi di dati in R, tuttavia di seguito sono riportati quelli utilizzati più di frequente:

Discutiamo ora ciascuno di questi tipi di dati individualmente, a partire da Vettori.

Vettori

I vettori sono gli oggetti dati R più basilari e ci sono sei tipi di vettori atomici. Di seguito sono riportati i sei vettori atomici:

Logico : Viene utilizzato per memorizzare valori logici come VERO o FALSO .

Numerico : Viene utilizzato per memorizzare sia numeri positivi che negativi compreso il numero reale.

Ad esempio: 25, 7.1145, 96547

Numero intero : Contiene tutti i valori interi, ovvero tutti i numeri interi positivi e negativi.

Ad esempio: 45.479, -856.479, 0

Complesso : Sono nella forma x + yi, dove xey sono numerici e i rappresenta la radice quadrata di -1.

Ad esempio: 4 + 3i

Personaggio : Viene utilizzato per memorizzare un singolo carattere, un gruppo di caratteri (parole) o un gruppo di parole insieme. I caratteri possono essere definiti tra virgolette singole o doppie.

Ad esempio: 'Edureka', 'R è divertente da imparare'.

In generale, un vettore viene definito e inizializzato nel modo seguente:

Vtr = c (2, 5, 11, 24) O Vtr<- c(2, 5, 11 , 24)

Andiamo avanti e comprendiamo altri tipi di dati in R.

Elenco

Le liste sono abbastanza simili ai vettori, ma le liste sono gli oggetti R che possono contenere elementi di diverso tipo come & meno numeri, stringhe, vettori e un altro elenco al suo interno.

Per esempio:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Produzione:

[[1]] [1] 'Ciao' 'Ciao' 'Come stai facendo '[[2]] [1] 22,5 [[3]] [1] 14965 [[4]] [1] VERO

Matrice

Matrix è l'oggetto R in cui gli elementi sono disposti in un layout rettangolare bidimensionale.

La sintassi di base per creare una matrice in R è & meno

 matrice (data, nrow, ncol, byrow, dimnames) 

Dove:

  • dati è il vettore di input che diventa l'elemento dati della matrice.
  • nrow è il numero di righe da creare.
  • ncol è il numero di colonne da creare.
  • byrow è un indizio logico. Se TRUE, gli elementi del vettore di input sono disposti per riga.
  • dimname sono i nomi assegnati alle righe e alle colonne.

Esempio:

è difficile da imparare
Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Produzione:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

VETTORE

Gli array in R sono oggetti dati che possono essere utilizzati per memorizzare dati in più di due dimensioni. Prende i vettori come input e utilizza i valori in no parametro per creare un array.

La sintassi di base per creare un array in R è & meno

 array (dati, dim, dimnames) 

Dove:

  • dati è il vettore di input che diventa gli elementi di dati della matrice.
  • no è la dimensione dell'array, dove si passa il numero di righe, colonna e il numero di matrici da creare con le dimensioni menzionate.
  • dimname sono i nomi assegnati alle righe e alle colonne.

Esempio:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Produzione:

, , uno [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Data Frame

Un data frame è una tabella o una struttura a matrice bidimensionale in cui ogni colonna contiene i valori di una variabile e ogni riga contiene un insieme di valoriperogni colonna. Di seguito sono elencate alcune delle caratteristiche di un Data Frame che devono essere considerate ogni volta che lavoriamo con loro:

  • I nomi delle colonne non devono essere vuoti.
  • Ogni colonna dovrebbe contenere la stessa quantità di elementi di dati.
  • I dati memorizzati in un data frame possono essere di tipo numerico, di fattore o di carattere.
  • I nomi delle righe dovrebbero essere univoci.

Esempio:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Sales', 'Finance', 'Marketing', 'HR ',' R & S ') emp. Dati<- data.frame(emp_id, emp_name, dept) emp.data 

Produzione:

emp_id emp_name dept 1100 John Sales 2 101 Henry Finance 3 102 Adam Marketing 4 103 Ron HR 5 104 Gary R & S

Quindi, ora che abbiamo compreso i tipi di dati di base di R, è tempo di immergerci in profondità in R comprendendo i concetti di Data Operator.

Programmazione R: operatori dati

Ci sono principalmente 4 operatori di dati in R, sono come mostrato di seguito:

Operatori aritmetici : Questi operatori ci aiutano a eseguire le operazioni aritmetiche di base come addizione, sottrazione, moltiplicazione, ecc.

Considera il seguente esempio:

num1 = 15 num2 = 20 num3 = 0 #addition num3 = num1 + num2 num3 #substraction num3 = num1 - num2 num3 #moltiplicazione num3 = num1 * num2 num3 #divisione num3 = num1 / num2 num3 #modulo num3 = num1 %% num2 num3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 #floor division num3 = num1% /% num2 num3

Produzione:

[1] 35 [quindici [1] 300 [1] 0,75 [1] 15 [1] 125 [undici

Operatori relazionali : Questi operatori ci aiutano a eseguire le operazioni relazionali come il controllo se una variabile è maggiore, minore o uguale a un'altra variabile. L'output di un'operazione relazionale è sempre un valore logico.

Considera i seguenti esempi:

num1 = 15 num2 = 20 # è uguale a num3 = (num1 == num2) num3 #non è uguale a num3 = (num1! = num2) num3 # minore di num3 = (num1 num2) num3 # meno di uguale a num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Produzione:

[1] FALSO [1] VERO [1] VERO [1] FALSO [1] VERO [1] FALSO

Operatori di assegnazione: Questi operatori vengono utilizzati per assegnare valori alle variabili in R. L'assegnazione può essere eseguita utilizzando l'operatore di assegnazione(<-) o operatore di uguale (=). Il valore della variabile può essere assegnato in due modi, assegnazione a sinistra e assegnazione a destra.

LogicoOperatori: Questi operatori confrontano le due entità e sono generalmente utilizzati con valori booleani (logici) come 'e', 'o'e'non'.


Programmazione R: istruzioni condizionali

  1. Istruzione If: L'istruzione If ti aiuta a valutare una singola espressione come parte del flusso. Per eseguire questa valutazione, è sufficiente scrivere la parola chiave If seguita dall'espressione da valutare. Il diagramma di flusso seguente darà un'idea di come l'istruzione If controlla il flusso di un codice: Considera il seguente esempio:
num1 = 10 num2 = 20 se (num1<=num2){ print('Num1 is less or equal to Num2') 

Produzione:

[1] 'Num1 è minore o uguale a Num2'
  • Istruzione Else If: L'istruzione Else if ti aiuta a estendere i rami al flusso creato dall'istruzione If e ti dà l'opportunità di valutare più condizioni creando nuovi rami di flusso. Il flusso seguente ti darà un'idea di come l'istruzione else if ramifica il flusso del codice:

    Considera il seguente esempio:

    Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 is lesser than Num1')} else if ('Num1 == Num2) {print (' Num1 and Num2 are Equal ')}

    Produzione:

    [1] 'Num1 è minore di Num2'

  • Istruzione Else: L'istruzione else viene utilizzata quando tutte le altre espressioni vengono controllate e trovate non valide. Questa sarà l'ultima istruzione che verrà eseguita come parte del ramo If - Else if. Il flusso seguente ti darà un'idea migliore di come Else altera il flusso del codice:

Considera il seguente esempio:

Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 is lesser than Num1')} else print ('Num1 and Num2 are Equal')}

Produzione:

[1] 'Num1 e Num2 sono uguali'

Programmazione R: loop

Un'istruzione loop ci consente di eseguire un'istruzione o un gruppo di istruzioni più volte. Esistono principalmente 3 tipi di loop in R:

  1. ripetere Loop : Ripete un'istruzione o un gruppo di istruzioni mentre una determinata condizione è VERA. Il ciclo di ripetizione è il miglior esempio di un ciclo controllato in uscita in cui il codice viene eseguito per la prima volta e quindi viene verificata la condizione per determinare se il controllo deve essere all'interno del ciclo o uscire da esso. Di seguito è riportato il flusso di controllo in un ciclo di ripetizione:
    Diamo un'occhiata all'esempio seguente per capire come possiamo usare il ciclo di ripetizione per aggiungere n numeri fino a quando la somma non supera 100:

    x = 2 ripetizione {x = x ^ 2 print (x) if (x> 100) {break}

    Produzione:

    [1] 4 [1] 16 [1] 256
  2. mentre Loop : iot aiuta a ripetere un'affermazione o un gruppo di affermazioni mentre una data condizione è VERA. Mentre il ciclo, rispetto al ciclo di ripetizione è leggermente diverso, è un esempio di un ciclo controllato dall'entrata in cui la condizione viene prima verificata e solo se la condizione è vera il controllo viene consegnato all'interno del ciclo per eseguire il codice . Di seguito è riportato il flusso di controllo in un ciclo while:
    Diamo un'occhiata all'esempio seguente per aggiungere la somma dei quadrati per i primi 10 numeri e capire come funziona meglio il ciclo while:

    num = 1 sumn = 0 while (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Produzione:

    [undici [quindici [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. per Loop : Viene utilizzato per ripetere un'istruzione o un gruppo di per un numero fisso di volte. A differenza di repeat e while loop, il ciclo for viene utilizzato in situazioni in cui siamo consapevoli del numero di volte in cui il codice deve essere eseguito in anticipo. È simile al ciclo while in cui la condizione viene prima controllata e poi viene eseguito solo il codice scritto all'interno. Vediamo ora il flusso di controllo del ciclo for:

Vediamo ora un esempio in cui useremo il ciclo for per stampare i primi 10 numeri:

per (x in 1:10) {print (x)}

Produzione:

[undici [1] 2 [1] 3 [1] 4 [quindici [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

Programmazione R: funzioni

Una funzione è un blocco di codice organizzato e riutilizzabile che viene utilizzato per eseguire una singola azione correlata. Esistono principalmente due tipi di funzioni in R:

Funzioni predefinite : Sono funzioni integrate che possono essere utilizzate dall'utente per eseguire il proprio lavoro easier. Ad esempio: mean( X) , Sum( X) , sqrt ( X ), in alto( X ), eccetera.

Definito dall'utente Funzioni: Queste funzioni sono create dall'utente per soddisfare un requisito specifico dell'utente. Di seguito è riportata la sintassi per creare una funzione inR:

 funz  nome_zione  <– funzione (arg_1, arg_2 e hellip){ // Corpo della funzione }

Considera il seguente esempio di una semplice funzione per generare la somma dei quadratidi2 numeri:

sum_of_square<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Uscita: [1] 25

Spero ti sia piaciuto leggere questo blog sulla programmazione R. Abbiamo coperto tutte le basi di R in questo tutorial, quindi puoi iniziare a esercitarti ora. Dopo questo blog di programmazione R, verranno in mente altri blog su R per Analytics, quindi rimanete sintonizzati.

Ora che hai compreso le basi di R, controlla il file da Edureka, una società di formazione online affidabile con una rete di oltre 250.000 studenti soddisfatti sparsi in tutto il mondo. L'analisi dei dati con formazione R di Edureka ti aiuterà ad acquisire esperienza in programmazione R, manipolazione dei dati, analisi esplorativa dei dati, visualizzazione dei dati, data mining, regressione, analisi del sentiment e utilizzo di RStudio per casi di studio reali su vendita al dettaglio, social media.

Hai domande per noi? Per favore, menzionalo nella sezione commenti di questo blog 'R Programming' e ti risponderemo il prima possibile.

cos'è init in python