Quali sono i prerequisiti per il machine learning?

Questo blog sui prerequisiti per Machine Learning ti aiuterà a comprendere i concetti di base che devi conoscere prima di iniziare con Machine Learning.

L'apprendimento automatico è senza dubbio la tecnologia più richiesta dell'epoca! Se sei un principiante che sta iniziando con il machine learning, è importante che tu conosca i prerequisiti per il machine learning. Questo blog ti aiuterà a comprendere i diversi concetti che devi conoscere prima di iniziare con Machine Learning.

Per avere una conoscenza approfondita dell'Intelligenza Artificiale e del Machine Learning, puoi iscriverti al live di Edureka con supporto 24 ore su 24, 7 giorni su 7 e accesso a vita.





Ecco un elenco di argomenti trattato in questo blog:

  1. Prerequisiti per l'apprendimento automatico
  2. Comprendere l'apprendimento automatico con un caso d'uso

Prerequisiti per l'apprendimento automatico

Per iniziareMachine Learning è necessario avere familiarità con i seguenti concetti:



  1. Statistiche
  2. Algebra lineare
  3. Calcolo
  4. Probabilità
  5. Linguaggi di programmazione

Statistiche

Le statistiche contengono strumenti che possono essere utilizzati per ottenere risultati dai dati. Esistono statistiche descrittive che vengono utilizzate per trasformare i dati grezzi in alcune informazioni importanti. Inoltre, le statistiche inferenziali possono essere utilizzate per ottenere informazioni importanti da un campione di dati invece di utilizzare un set di dati completo.

Per saperne di più su Statistiche puoi consultare i seguenti blog:

Algebra lineare

Trattamenti di algebra linearecon vettori, matrici e trasformazioni lineari. È molto importante nell'apprendimento automatico in quanto può essere utilizzato per trasformare ed eseguire operazioni sul set di dati.



java ordina un elenco di numeri interi

Calcolo

Il calcolo è un campo importante della matematica e svolge un ruolo fondamentale in molti algoritmi di apprendimento automatico. I set di dati con più funzionalità sonoutilizzato per creare modelli di apprendimento automatico poiché le funzionalità sono più calcoli multivariabili svolge un ruolo importante per creare un modello di apprendimento automatico. Le integrazioni e le differenziazioni sono un must.

Probabilità

La probabilità aiuta a prevedere la probabilità degli eventi, ci aiuta a pensare che la situazione possa o meno accadere di nuovo. Per l'apprendimento automatico, la probabilità è un file fondazione.

Mathematics

Per saperne di più sulla probabilità, puoi passare attraverso questo Blog.

Linguaggio di programmazione

È essenziale conoscere linguaggi di programmazione come R e Python per implementare l'intero processo di Machine Learning. Python e R forniscono entrambi librerie integrate che semplificano l'implementazione di algoritmi di Machine Learning.

Oltre ad avere una conoscenza di programmazione di base, è anche importante che tu sappia come estrarre, elaborare e analizzare i dati. Questa è una delle competenze più importanti necessarie per l'apprendimento automatico.

Per saperne di più sulla programmazione lingue per Machine Learning, puoi consultare i seguenti blog:

  1. Le migliori librerie Python per data science e machine learning

Caso di utilizzo del machine learning

L'apprendimento automatico consiste nel creare un algoritmo in grado di apprendere dai dati per fare una previsione come i tipi di oggetti presenti nell'immagine, o il motore di raccomandazione, la migliore combinazione di farmaci per curare una determinata malattia o il filtro dello spam.

L'apprendimento automatico si basa su prerequisiti matematici e se sai perché la matematica viene utilizzata nell'apprendimento automatico, lo renderà divertente. Devi conoscere la matematica alla base delle funzioni che utilizzerai e quale modello è adatto ai dati e perché.

Quindi iniziamo con un problema interessante di previsione dei prezzi delle case, avendo un set di dati contenente una cronologia di caratteristiche e prezzi diversi, per ora considereremo l'area della superficie abitabile in piedi quadrati e i prezzi.

Ora abbiamo un set di dati contenente due colonne come mostrato di seguito:

Ci deve essere una correlazione tra queste due variabili per scoprire che avremo bisogno di costruire un modello in grado di prevedere il prezzo delle case, come possiamo farlo?

Rappresentiamo graficamente questi dati e vediamo come appaiono:

Qui l'asse X è il prezzo per piede quadrato di spazio vitale e l'asse Y è il prezzo della casa. Se tracciamo tutti i punti dati, otterremo un grafico a dispersione che può essere rappresentato da una linea come mostrato nella figura sopra e se inseriamo alcuni dati, predice un risultato. Idealmente, dobbiamo trovare una linea che intersechi i punti dati massimi.

Qui stiamo cercando di creare una linea che viene definita come:

Y = mX + c

Questo metodo di previsione della relazione lineare tra l'obiettivo (variabile dipendente) e la variabile predittore (variabile indipendente) è definito regressione lineare. Ci permette di studiare e riassumere una relazione tra due variabili.

  • X = variabile indipendente
  • Y = variabile dipendente
  • c = intercetta y
  • m = Pendenza della linea

Se consideriamo l'equazione abbiamo valori per X che è una variabile indipendente, quindi tutto ciò che dobbiamo fare è calcolare i valori per m e c per prevedere il valore di Y.

Allora come troviamo queste variabili?

Per trovare queste variabili, possiamo provare una serie di valori e provare a trovare una linea che interseca il numero massimo di punti dati. Ma come possiamo trovare la linea più adatta?

Quindi, per trovare la retta più adatta, possiamo usare la funzione di errore dei minimi quadrati che troverà l'errore tra il valore reale di y e il valore previsto y`.

La funzione di errore dei minimi quadrati può essere rappresentata utilizzando la seguente equazione:

Usando questa funzione possiamo scoprire l'errore per ogni punto dati previsto confrontandolo con il valore effettivo del punto dati. Quindi prendi la somma di tutti questi errori e li quadretti per scoprire la deviazione nella previsione.

Se aggiungiamo il terzo asse al nostro grafico contenente tutti i possibili valori di errore e lo tracciamo in uno spazio tridimensionale, apparirà così:

Nell'immagine sopra, i valori ideali sarebbero nella parte nera in basso che predice i prezzi vicini al punto dati effettivo. Il passaggio successivo consiste nel trovare i migliori valori possibili per m e c. Questo può essere fatto utilizzando la tecnica di ottimizzazione chiamata discesa del gradiente.

La discesa del gradiente è un metodo iterativo, in cui iniziamo con l'inizializzazione di una serie di valori per le nostre variabili e li miglioriamo lentamente riducendo al minimo l'errore tra il valore effettivo e il valore previsto.

Ora, se pensiamo che praticamente i prezzi dell'appartamento non dipendono solo dal prezzo per metro quadrato, ci sono molti fattori come il numero di camere da letto, bagni, ecc. Se consideriamo anche queste caratteristiche, l'equazione sembrerà qualcosa come questo

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

come creare dashboard in power bi

Questa è la regressione multilineare che appartiene all'algebra lineare, qui possiamo usare matrici di dimensione mxn dove m sono caratteristiche en sono punti dati.

Consideriamo un'altra situazione in cui possiamo usare la probabilità per trovare le condizioni della casa al fine di classificare una casa in base al fatto che sia in buone o cattive condizioni. Per questo, per funzionare dovremo utilizzare una tecnica chiamata Regressione Logistica che lavora sulla probabilità di occorrenze rappresentata da una funzione sigmoidea.

In questo articolo, abbiamo trattato i prerequisiti dell'apprendimento automatico e come vengono applicati nell'apprendimento automatico. Quindi, fondamentalmente, consiste in statistica, calcolo, algebra lineare e teoria della probabilità. Il calcolo ha tecniche utilizzate per l'ottimizzazione, l'algebra lineare ha algoritmi che possono lavorare su enormi set di dati, con probabilità possiamo prevedere la probabilità di eventi e le statistiche ci aiutano a dedurre informazioni utili dal campione di set di dati.

Ora che conosci i prerequisiti per il machine learning, sono sicuro che sei curioso di saperne di più. Di seguito sono riportati alcuni blog che ti aiuteranno a iniziare con la scienza dei dati:

Se desideri iscriverti a un corso completo su Intelligenza Artificiale e Machine Learning, Edureka ha un che ti renderà esperto in tecniche come l'apprendimento supervisionato, l'apprendimento non supervisionato e l'elaborazione del linguaggio naturale. Include la formazione sugli ultimi progressi e approcci tecnici in Intelligenza Artificiale e Machine Learning come Deep Learning, Modelli grafici e Reinforcement Learning.