Apprendimento supervisionato in Apache Mahout



L'apprendimento supervisionato è una tecnica di apprendimento automatico, in cui una funzione viene dedotta dagli esempi etichettati di dati di addestramento.

L'apprendimento supervisionato è il metodo, in cui i dati di formazione includono sia l'input che i risultati desiderati. L'addestramento del sistema con esempi è chiamato apprendimento supervisionato. Oppure, anche l'addestramento dell'algoritmo con un insegnante può essere trattato come apprendimento supervisionato. Dopo aver addestrato l'algoritmo con tutti i dati del campione oi dati etichettati, che ha entrambi i predittori sulla variabile target, è possibile addestrare l'algoritmo e utilizzare l'esempio invisibile per un'ulteriore classificazione.





Ecco alcune delle caratteristiche importanti dell'apprendimento supervisionato in Mahout:

  • La costruzione di un adeguato set di addestramento, validazione e test (Bok) è fondamentale.
  • Questi metodi sono generalmente rapidi e precisi.
  • I metodi di apprendimento supervisionato devono essere in grado di generalizzare.
  • Forniscono risultati corretti, quando vengono forniti nuovi dati in input senza conoscere aprioribersaglio.
  • In alcuni casi, i risultati corretti (obiettivi) sono noti e forniti in input al modello durante il processo di apprendimento.

Esempio di apprendimento supervisionato

Nel caso in cui desideri addestrare una missione e ti vengono dati due diversi gruppi di immagini insieme ai dati etichettati, ad es. nella foto sopra, un gruppo ha le immagini di un elefante e l'altro ha quelle di un leone. I dati etichettati implicano che ogni set di dati abbia un valore di destinazione. Nell'esempio precedente, il set di dati è costituito da immagini di elefanti, mentre l'etichetta assegnata ad esso, ovvero 'Elefante', è il valore target del set di dati. Tale set di dati etichettato viene utilizzato per il processo di addestramento, in modo che l'algoritmo di addestramento possa sfruttare questo set di dati e costruire un modello, che può essere ulteriormente utilizzato per classificare gli esempi invisibili senza i dati etichettati o la variabile di destinazione.



Identifichiamo le caratteristiche che aiutano a identificare un oggetto come un elefante o un leone:

Le caratteristiche potrebbe essere - taglia, colore, altezza, dimensione dell'orecchio, tronco, zanna

Questo può essere definito un set di funzionalità, che verrà utilizzato a scopo di formazione. Questo set di funzionalità influirà sulla variabile di destinazione finale. Queste variabili sono note come variabili predittive , perché ci aiutano a determinare il variabile di destinazione finale . La variabile finale può anche essere chiamata etichetta. La variabile finale ecco l'elefante / leone.



come trovare la lunghezza di un array in javascript

table-word

In questo esempio, ciascuno dei record nelle categorie, taglia, colore, altezza, dimensione dell'orecchio, tronco e zanna è una variabile predittiva, mentre Elefante e Leone sono le variabili target. Queste variabili possono essere trattate rispettivamente come esempi di addestramento e set di dati di addestramento.

Pertanto, l'apprendimento supervisionato è un modo, attraverso il quale ti alleni insieme alle etichette, in cui chiedi all'algoritmo di estrarne determinate funzionalità e, in base a ciò, ogni volta che vedi un esempio invisibile, l'algoritmo sarà in grado di classificarlo nella classe giusta.

Hai domande per noi? Menzionateli nella sezione commenti e vi risponderemo.

Post correlati: