Cos'è una rete neurale? Introduzione alle reti neurali artificiali



Questo blog su cosa sono le reti neurali ti introdurrà ai concetti di base delle reti neurali e come possono risolvere problemi complessi basati sui dati.

Con il progresso nel machine learning, ha preso una strada maestra. Il Deep Learning è considerato la tecnologia più avanzata creata per risolvere problemi complessi che utilizzano enormi set di dati. Questo blog su cosa sono le reti neurali ti introdurrà ai concetti di base delle reti neurali e come possono risolvere problemi complessi basati sui dati.

Per avere una conoscenza approfondita dell'Intelligenza Artificiale e del Deep Learning, puoi iscriverti al live di Edureka con supporto 24 ore su 24, 7 giorni su 7 e accesso a vita.





Ecco un elenco di argomenti che verranno trattati in questo Blog:

  1. Cos'è una rete neurale?
  2. Cos'è il deep learning?
  3. Differenza tra AI, ML e DL
  4. Necessità di deep learning
  5. Caso di utilizzo del deep learning
  6. Come funzionano le reti neurali?
  7. Rete neurale spiegata con l'esempio

Semplice definizione di una rete neurale

Modellato secondo il cervello umano, a La rete neurale è stata creata per imitare la funzionalità di un cervello umano . Il cervello umano è una rete neurale composta da più neuroni, allo stesso modo, una rete neurale artificiale (ANN) è composta da più percettroni (spiegato più avanti).



Rete neurale - Che cos

Una rete neurale è composta da tre importanti livelli:

  • Livello di input: Come suggerisce il nome, questo livello accetta tutti gli input forniti dal programmatore.
  • Livello nascosto: Tra il livello di input e quello di output c'è un insieme di livelli noto come livelli nascosti. In questo livello, vengono eseguiti i calcoli che producono l'output.
  • Livello di output: Gli input passano attraverso una serie di trasformazioni tramite il livello nascosto che alla fine si traduce nell'output che viene fornito tramite questo strato.

Prima di entrare nei dettagli di come funziona una rete neurale, capiamo cos'è il deep learning.



Cos'è il deep learning?

Il Deep Learning è un campo avanzato del Machine Learning che utilizza i concetti di reti neurali per risolvere casi d'uso altamente computazionali che coinvolgono l'analisi di dati multidimensionali. Automatizza il processo di estrazione delle caratteristiche, assicurando che sia necessario un intervento umano minimo.

Allora, cos'è esattamente il Deep Learning?

Il Deep Learning è un avanzato sottocampo del Machine Learning che utilizza algoritmi ispirati alla struttura e alla funzione del cervello denominati Reti Neurali Artificiali.

Differenza tra AI, ML e DL (intelligenza artificiale vs machine learning vs deep learning)

Le persone spesso tendono a pensarlo , , e Apprendimento approfondito sono gli stessi poiché hanno applicazioni comuni. Ad esempio, Siri è un'applicazione di AI, Machine learning e Deep learning.

cos'è il metodo tostring in java

Allora come sono correlate queste tecnologie?

  • Intelligenza artificiale è la scienza per far sì che le macchine imitino il comportamento degli esseri umani.
  • Apprendimento automatico è un sottoinsieme dell'intelligenza artificiale (AI) che si concentra sul convincere le macchine a prendere decisioni alimentando loro i dati.
  • Apprendimento approfondito è un sottoinsieme di Machine Learning che utilizza il concetto di reti neurali per risolvere problemi complessi.

Per riassumere, AI, Machine Learning e Deep Learning sono campi interconnessi. L'apprendimento automatico e l'apprendimento profondo aiutano l'intelligenza artificiale fornendo una serie di algoritmi e reti neurali da risolvere problemi basati sui dati.

Ora che hai familiarità con le basi, vediamo cosa ha portato alla necessità di Deep Learning.

Necessità di deep learning: limitazioni degli algoritmi e delle tecniche di machine learning tradizionali

Il machine learning è stato un importante passo avanti nel mondo tecnico, ha portato all'automazione di attività monotone e dispendiose in termini di tempo, ha aiutato a risolvere problemi complessi e a prendere decisioni più intelligenti. Tuttavia, c'erano alcuni inconvenienti nell'apprendimento automatico che hanno portato all'emergere del deep learning.

Ecco alcune limitazioni dell'apprendimento automatico:

  1. Impossibile elaborare dati di dimensioni elevate: L'apprendimento automatico può elaborare solo piccole dimensioni di dati che contengono un piccolo insieme di variabili. Se desideri analizzare dati contenenti centinaia di variabili, non è possibile utilizzare Machine Learning.
  2. La progettazione delle funzionalità è manuale: Considera un caso d'uso in cui hai 100 variabili predittive e devi restringere solo quelle significative. Per fare questo è necessario studiare manualmente la relazione tra ciascuna delle variabili e capire quali sono importanti per prevedere l'output. Questa attività è estremamente noiosa e richiede tempo per uno sviluppatore.
  3. Non ideale per eseguire il rilevamento di oggetti e l'elaborazione delle immagini: Poiché il rilevamento di oggetti richiede dati ad alta dimensione, Machine Learning non può essere utilizzato per elaborare set di dati di immagini, è ideale solo per set di dati con un numero limitato di funzionalità.

Prima di entrare nelle profondità di Reti neurali, consideriamo un caso d'uso del mondo reale in cui viene implementato il deep learning.

Caso d'uso / applicazioni di deep learning

Sapevi che PayPal elabora oltre $ 235 miliardi di pagamenti da quattro miliardi di transazioni da parte dei suoi oltre 170 milioni di clienti? Utilizza questa grande quantità di dati per identificare possibili attività fraudolente tra gli altri motivi.

Con l'aiuto di algoritmi di Deep Learning, PayPal ha estratto i dati dalla cronologia degli acquisti del cliente oltre a rivedere i modelli di probabili frodi archiviati nei suoi database per prevedere se una determinata transazione è fraudolenta o meno.

L'azienda si affida alla tecnologia Deep Learning e Machine Learning da circa 10 anni. Inizialmente, il team di monitoraggio delle frodi utilizzava modelli semplici e lineari. Ma nel corso degli anni l'azienda è passata a una tecnologia di Machine Learning più avanzata chiamata Deep Learning.

Ke Wang, responsabile del rischio di frode e Data Scientist di PayPal, ha dichiarato:

'Quello che ci piace dall'apprendimento automatico più moderno e avanzato è la sua capacità di consumare molti più dati, gestire livelli e livelli di astrazione ed essere in grado di' vedere 'cose ​​che una tecnologia più semplice non sarebbe in grado di vedere, anche gli esseri umani potrebbero non essere in grado di vedere. '

Un semplice modello lineare è in grado di consumare circa 20 variabili. Tuttavia, con la tecnologia Deep Learning è possibile eseguire migliaia di punti dati. Pertanto, implementando Grazie alla tecnologia Deep Learning, PayPal può finalmente analizzare milioni di transazioni per identificare eventuali fraudolenti attività.

Ora andiamo nelle profondità di una rete neurale e capiamo come funzionano.

Come funziona una rete neurale?

Per comprendere le reti neurali, dobbiamo scomporla e comprendere l'unità di base di una rete neurale, ovvero un Perceptron.

Cos'è un Perceptron?

Un Perceptron è una rete neurale a livello singolo utilizzata per classificare i dati lineari. Ha 4 componenti importanti:

compilatore just in time java
  1. Ingressi
  2. Pesi e Bias
  3. Funzione di somma
  4. Funzione di attivazione o trasformazione

La logica di base dietro un Perceptron è la seguente:

Gli input (x) ricevuti dal livello di input vengono moltiplicati per i pesi assegnati w. I valori moltiplicati vengono quindi aggiunti per formare la somma ponderata. La somma ponderata degli ingressi e dei rispettivi pesi vengono quindi applicati a una relativa funzione di attivazione. La funzione di attivazione mappa l'ingresso alla rispettiva uscita.

Pesi e pregiudizi nel deep learning

Perché dobbiamo assegnare pesi a ogni input?

Una volta che una variabile di input viene fornita alla rete, un valore scelto casualmente viene assegnato come peso di tale input. Il peso di ogni punto di dati di input indica quanto sia importante quell'input nella previsione del risultato.

Il parametro bias, invece, consente di regolare la curva della funzione di attivazione in modo tale da ottenere un'uscita precisa.

Funzione di somma

Una volta assegnato un peso agli ingressi, viene preso il prodotto del rispettivo ingresso e del peso. L'aggiunta di tutti questi prodotti ci dà la somma ponderata. Questo viene fatto dalla funzione di sommatoria.

Funzione di attivazione

Lo scopo principale delle funzioni di attivazione è quello di mappare la somma ponderata sull'uscita. Le funzioni di attivazione come tanh, ReLU, sigmoid e così via sono esempi di funzioni di trasformazione.

Per saperne di più sulle funzioni di Perceptrons, puoi passare attraverso questo Blog.

Prima noi concludere questo blog, facciamo un semplice esempio per capire come funziona una rete neurale.

Reti neurali spiegate con un esempio

Considera uno scenario in cui devi costruire una rete neurale artificiale (ANN) che classifica le immagini in due classi:

  • Classe A: contenente immagini di foglie non malate
  • Classe B: contenente immagini di foglie malate

Allora come si crea una rete neurale che classifica le foglie in colture malate e non malate?

Il processo inizia sempre con l'elaborazione e la trasformazione dell'input in modo tale che possa essere facilmente elaborato. Nel nostro caso, ogni immagine foglia sarà suddivisa in pixel a seconda della dimensione dell'immagine.

Ad esempio, se l'immagine è composta da 30 per 30 pixel, il numero totale di pixel sarà 900. Questi pixel sono rappresentati come matrici, che vengono quindi immessi nel livello di input della rete neurale.

Proprio come il nostro cervello ha neuroni che aiutano a costruire e collegare pensieri, una ANN ha perceptrons che accettano input e li elaborano trasmettendoli dallo strato di input a quello nascosto e infine a quello di output.

Quando l'input viene passato dal livello di input al livello nascosto, a ciascun input viene assegnato un peso casuale iniziale. Gli input vengono quindi moltiplicati per i pesi corrispondenti e la loro somma viene inviata come input al livello nascosto successivo.

Qui, un valore numerico chiamato bias viene assegnato a ciascun perceptron, che è associato al peso di ogni input. Inoltre, ogni perceptron passa attraverso l'attivazione o una funzione di trasformazione che determina se un particolare perceptron viene attivato o meno.

Un perceptron attivato viene utilizzato per trasmettere i dati al livello successivo. In questo modo, i dati vengono propagati (propagazione diretta) attraverso la rete neurale fino a quando i perceptrons raggiungono lo strato di output.

A livello di output, viene derivata una probabilità che decide se i dati appartengono alla classe A o B.

Sembra semplice, vero? Ebbene, il concetto alla base delle reti neurali si basa esclusivamente sul funzionamento del cervello umano. È necessaria una conoscenza approfondita di vari concetti e algoritmi matematici. Ecco un elenco di blog per iniziare:

  1. Cos'è il deep learning? Introduzione al deep learning
  2. Deep learning con Python: guida per principianti al deep learning

Se hai trovato questo blog pertinente, controlla il da Edureka, una società di formazione online affidabile con una rete di oltre 250.000 studenti soddisfatti sparsi in tutto il mondo. Il corso di formazione sulla certificazione Edureka Deep Learning con TensorFlow aiuta gli studenti a diventare esperti nella formazione e nell'ottimizzazione delle reti neurali di base e convoluzionali utilizzando progetti e incarichi in tempo reale insieme a concetti come la funzione SoftMax, le reti neurali con codificatore automatico, la macchina Boltzmann ristretta (RBM).