Processo di analisi predittiva in Business Analytics con R



Il blog fornisce una breve idea del processo di analisi predittiva in Business Analytics con R

Processo di modellazione tipico:

In un tipico processo di modellazione, è importante iniziare a disegnare un'ipotesi. Viene ricevuta una RFP (Request for Proposal) e quindi viene elaborata un'ipotesi.





come invertire un numero
  1. Determina l'origine dati corretta - Qui, il cliente può fornire un'origine dati, in caso contrario, dobbiamo cercare un'origine dati. Dato uno scenario, in cui proviamo a valutare chi vincerebbe le elezioni, un'analisi pubblica dei dati viene eseguita con fonti che includono social media, canali di notizie o opinione pubblica. Dobbiamo anche capire la quantità di dati necessari per analizzare il problema. In questo caso, in genere cerchiamo campioni di grandi dimensioni, poiché si tratta di un caso elettorale. D'altra parte, se l'analisi viene fatta sulla Sanità, è difficile andare per una grande popolazione perché c'è la possibilità di non ottenere abbastanza persone per convalidare l'ipotesi. Inoltre, la qualità dei dati è molto importante.
  2. Estrai dati - Ad esempio, se prendiamo un campione di popolazione, possiamo esaminare attributi, come reddito alto, reddito basso, età, popolazione attiva (fuori sede / in sede), residenti, NRI, copertura di ospedali, ecc., Per avviare lo studio . Qui, potremmo non aver bisogno di così tanti attributi per l'ipotesi. Comprendiamo che attributi, come reddito alto e basso, potrebbero non essere i fattori che contribuiscono a determinare chi vincerà le elezioni. Ma l'età può fare la differenza in quanto darà un conteggio diretto di quante persone voteranno. Molte volte possiamo escludere attributi meno utilizzati o includere attributi utili. Potrebbe andare storto in entrambi i casi. Questo è il motivo per cui l'analisi è una sfida.
  3. Massaggia i dati per adattarli allo strumento - Questo perché non tutti gli strumenti possono accettare tutti i dati. Alcuni strumenti accettano solo dati CSV o dati Excel. La mancanza di strumenti è una sfida.
  4. Esegui l'analisi - Questa operazione può essere eseguita utilizzando molte tecniche di analisi.
  5. Traccia le conclusioni - L'analisi fornisce numeri per essere precisi. Ma spetta a un utente trarre conclusioni da questi numeri. Ad esempio, se dice 10% o 20%, dobbiamo capire cosa significa? Deriva la correlazione tra l'attributo A e l'attributo B?
  6. Implementare i risultati - È importante implementare le conclusioni per vedere i risultati negli affari. Ad esempio, si può concludere che 'La gente compra l'ombrello nella stagione delle piogge' che può portare a più affari. Qui, dobbiamo implementare la conclusione in cui facciamo l'ombrello, disponibile nei negozi, ma poi può avere problemi di gestione. Nel momento in cui le statistiche danno risultati, l'implementazione potrebbe non funzionare.
  7. Monitorare i progressi - L'ultimo passaggio qui, il monitoraggio gioca un ruolo importante. Il monitoraggio può andare storto perché non molte organizzazioni desiderano monitorare i progressi ed è considerato un passaggio trascurabile. Ma il monitoraggio è importante perché possiamo capire se la nostra ricerca e le nostre conclusioni stanno andando nella giusta direzione.

Controlla anche questo articolo' La correlazione non significa causalità 'che dà un'idea di come gli analisti possono sbagliare. Un punto importante da notare in questo grafico è che l'esecuzione dell'analisi è l'unico passaggio in cui la macchina è responsabile e oltre a ciò spetta a un essere umano che alla fine determinerà come viene eseguita la ricerca.

Hai domande per noi? Menzionateli nella sezione commenti e vi risponderemo.



vantaggi del sovraccarico del metodo in java

Post correlati: