Tecniche di modellazione in Business Analytics con R



Il blog offre una breve introduzione alle tecniche di modellazione in Business Analytics con R.

Diverse tecniche di modellazione:

Possiamo suddividere qualsiasi problema in processi più piccoli:





Classificazione - è, dove classifichiamo i dati. Per esempio. malattie tutte le malattie mostrano un certo comportamento e possiamo classificarle ulteriormente.

Ad esempio: malattie che riducono l'immunità, malattie che danno mal di testa, ecc.



Regressione - implica la scoperta della relazione tra più variabili.

Ad esempio: come il peso di un essere umano è correlato alla sua altezza.

come impostare il percorso java in Windows

AnomolyRilevamento - è fondamentalmente una fluttuazione.



Ad esempio: in caso di alta o bassa tensione.

Un altro esempio potrebbe includere un comportamento regolamentato che prevede la guida sul lato destro o sinistro in base al paese. L'anomalia qui è qualcuno che guida dall'opposto.

Un altro esempio potrebbe essere l'intrusione di rete. In questo caso, un utente autenticato accede al sito web della tua azienda, quindi se qualcuno non autenticato accede, è unAn0moly.

Importanza degli attributi - Fondamentalmente fornisce più attributi, come altezza, peso, temperatura, battito cardiaco. Un punto da notare è che tutti questi attributi sono importanti per un'attività.

java come usare tostring

Ad esempio: qualcuno sta cercando di prevedere a che ora una persona raggiungerà l'ufficio. Ogni attributo gioca un ruolo importante ma non tutti gli attributi sono importanti.

Regole dell'Associazione - In termini più semplici, è analizzare o prevedere il comportamento successivo, dove ruota attorno al motore di raccomandazione.

Ad esempio: una persona che acquista il pane può anche acquistare il latte. Se analizziamo i comportamenti di acquisto passati, tutti gli articoli nel carrello hanno una relazione. In questo caso, potrebbe esserci una probabilità che la persona che acquista il pane acquisti anche il latte.

Clustering - È una delle più antiche tecniche di statistica. In effetti, si può sempre modellare qualsiasi problema, sia esso classificazione o raggruppamento, il che significa raggruppare entità simili.

Per esempio:

1) Prendi un cesto di mele e arance, in cui possiamo separare le mele dalle arance.

2) Un caso d'uso importante per il clustering è l'assistenza sanitaria. Quasi tutte le statistiche e le analisi sono iniziate con casi d'uso dell'assistenza sanitaria. Per approfondire, esiste un termine di raggruppamento chiamato coorti (persone con malattie simili), in modo che possano essere studiate separatamente dai clienti esistenti. Ad esempio, se 10 persone soffrono di febbre e altre 10 persone di mal di testa, troveremo ciò che è comune tra loro e genereremo medicine.

Estrazione delle caratteristiche - Nell'estrazione di elementi l'accuratezza, la validità e il fallimento sono abbastanza rilevanti. In altre parole, l'estrazione di feature può essere definita riconoscimento di pattern.

trasformazione attiva e passiva in informatica

Per esempio:

Nella ricerca di Google, quando un utente inserisce un termine, vengono visualizzati i risultati. Ora, una domanda importante da porre è come faceva a sapere quale pagina è pertinente e non rilevante per il termine? A questo si può rispondere con l'estrazione delle caratteristiche e il riconoscimento dei modelli, dove aggiunge caratteristiche importanti. Diciamo che una foto viene fornita, alcune fotocamere rilevano i volti, evidenziano il viso per dare belle immagini, che utilizza anche il riconoscimento delle funzionalità.

Apprendimento supervisionato vs apprendimento non supervisionato

per) Categoria di previsione - Le tecniche includono regressione, logistica, reti neurali e alberi decisionali. Alcuni esempi includono il rilevamento delle frodi (dove un computer apprende e predice la prossima frode dalla precedente storia di frode). Nell'apprendimento non supervisionato, non è possibile prevedere con esempi poiché non ci sono dati storici.

b) Categoria di classificazione - Facendo un esempio, sia che la transazione sia fraudolenta o meno, entra nella categoria di classificazione. Qui, prendiamo i dati storici e li classifichiamo con alberi decisionali o, nel caso in cui non prendiamo alcun dato storico, iniziamo direttamente dai dati e proviamo a sfruttare le funzionalità da soli. Ad esempio, se abbiamo bisogno di conoscere i dipendenti, che probabilmente lasceranno l'organizzazione o che probabilmente rimarranno. Nel caso in cui si tratti di una nuova organizzazione, in cui non possiamo utilizzare i dati storici, possiamo sempre utilizzare il clustering per l'estrazione dei dati.

c) Categoria di esplorazione - Questo è un metodo semplice, inventando cosa significano i big data. Nell'apprendimento non supervisionato, si chiama componenti principali e clustering.

d) Categoria di affinità - qui sono coinvolti più elementi come cross-sell / up sell, analisi del paniere di mercato. Nell'analisi del paniere, non c'è apprendimento supervisionato in quanto non ci sono dati storici. Quindi prendiamo direttamente i dati e troviamo associazioni, sequenziamento e analisi fattoriale.

Hai domande per noi? Menzionateli nella sezione commenti e vi risponderemo.

Post correlati: