Tutorial Python Seaborn: cos'è Seaborn e come usarlo?



Python Seaborn tutorial sulla differenza tra seaborn e matplotlib. Scopri anche le varie funzioni e personalizzazioni disponibili in Seaborn.

Python è un magazzino di numerose librerie e framework immensamente potenti. Tra questi c'è Seaborn, che è una dominante visualizzazione dati libreria, garantendo ancora un altro motivo per completare i programmatori . In questo tutorial di Python Seaborn, imparerai tutte le abilità di visualizzazione dei dati usando Seaborn.

Prima di proseguire, diamo uno sguardo a tutti gli argomenti di discussione in questo articolo:





Quindi iniziamo prima ragionando sull'importanza di Python Seaborn.

Perché usare Python Seaborn?

Come accennato in precedenza, la libreria Python Seaborn viene utilizzata per facilitare il compito impegnativo della visualizzazione dei dati ed è basata su . Seaborn permette la creazione di grafici statistici attraverso le seguenti funzionalità:



  • Un'API basata su set di dati che consente il confronto tra più file variabili

  • Supporta griglie multi-trama che a loro volta facilitano la creazione di visualizzazioni complesse

    test cross browser in selenio
  • Visualizzazioni univariate e bivariate disponibili per il confronto tra sottoinsiemi di dati



  • Disponibilità di diverse tavolozze di colori per rivelare vari tipi di motivi

  • Stime e grafici automaticamente

Quindi, se ti stavi chiedendo perché usare Seaborn quando hai già Matplotlib, ecco la risposta.

Python Seaborn contro Matplotlib:

'Se Matplotlib' cerca di rendere facili le cose facili e le cose difficili possibili ', Seaborn cerca di rendere facili anche un insieme ben definito di cose difficili' - Michael Waskom (Creator of Seaborn).
In realtà, Matplotlib è buono ma Seaborn è migliore. Ci sono fondamentalmente due difetti di Matplotlib che Seaborn corregge:

  1. Matplotlib può essere personalizzato ma è difficile capire quali impostazioni sono necessarie per rendere i grafici più attraenti. D'altra parte, Seaborn viene fornito con numerosi temi personalizzati e interfacce di alto livello per risolvere questo problema.

  2. Quando si lavora con Panda , Matplotlib non funziona bene quando si tratta di gestire DataFrame, mentre le funzioni di Seaborn funzionano effettivamente su DataFrame.

Come installare Seaborn?

Per installare la libreria Python Seaborn, puoi utilizzare i seguenti comandi in base alla piattaforma che utilizzi:

pip installa seaborn

o

conda installare seaborn

Una volta installato, assicurati di installare i pacchetti e le librerie da cui dipende seaborn.

Installazione delle dipendenze Python Seaborn:

Le dipendenze obbligatorie per seaborn sono:

C'è anche una dipendenza consigliata che è:

  • modelli di stato

Per installare queste librerie, è possibile utilizzare gli stessi comandi mostrati in precedenza per Seaborn con i rispettivi nomi. Una volta installati, possono essere importati facilmente. Seaborn ti consente di caricare qualsiasi set di dati da usando il load_dataset () funzione. È inoltre possibile visualizzare tutti i set di dati disponibili utilizzando la funzione get_dataset_names () come segue:

ESEMPIO:

importa seaborn come sns sns.get_dataset_names ()

Ciò restituirà un elenco di tutti i set di dati disponibili.
Ora che hai impostato il tuo ambiente per lavorare con Seaborn, passiamo oltre per vedere come utilizzare le sue funzioni di tracciamento in .

Funzioni di plottaggio di Seaborn

Visualizzazione delle relazioni statistiche:

Il processo di comprensione delle relazioni tra le variabili di un set di dati e il modo in cui queste relazioni, a loro volta, dipendono da altre variabili è noto come analisi statistica. Diamo ora uno sguardo più approfondito alle funzioni necessarie per questo:

relplot ():

Questa è una funzione a livello di figura che fa uso di altre due funzioni degli assi per visualizzare le relazioni statistiche che sono:

  • scatterplot ()
  • lineplot ()

Queste funzioni possono essere specificate utilizzando il parametro 'kind' di relplot (). Nel caso in cui venga fornito questo parametro, prende quello predefinito che è scatterplot (). Prima di iniziare a scrivere il codice, assicurati di importare le librerie richieste come segue:

importa numpy come np importa panda come pd importa matplotlib.pyplot come plt importa seaborn come sns sns.set (style = 'darkgrid')

Si noti che anche l'attributo style è personalizzabile e può assumere qualsiasi valore come darkgrid, tick, ecc. Di cui parlerò più avanti nella sezione relativa all'estetica della trama. Diamo ora un'occhiata a un piccolo esempio:

ESEMPIO:

f = sns.load_dataset ('voli') sns.relplot (x = 'passeggeri', y = 'mese', dati = f)

PRODUZIONE:

Voli1-Python Seaborn Tutorial-Edureka

Come puoi vedere, i punti sono tracciati in 2 dimensioni. Tuttavia, puoi aggiungere un'altra dimensione utilizzando la semantica 'tonalità'. Diamo un'occhiata a un esempio dello stesso:

ESEMPIO:

f = sns.load_dataset ('voli') sns.relplot (x = 'passeggeri', y = 'mese', tonalità = 'anno', dati = f)

Vedrai il seguente output:

PRODUZIONE:

Tuttavia, ci sono molte altre personalizzazioni che puoi provare come colori, stili, dimensioni, ecc. Lascia che ti mostri come puoi cambiare il colore nel seguente esempio:

ESEMPIO:

sns.set (style = 'darkgrid') f = sns.load_dataset ('voli') sns.relplot (x = 'passenger', y = 'month', hue = 'year', palette = 'ch: r = - .5, l = .75 ', data = f)

PRODUZIONE:

lineplot ():

Questa funzione ti permetterà di disegnare una linea continua per i tuoi dati. Puoi utilizzare questa funzione modificando il parametro 'kind' come segue:

ESEMPIO:

a = pd.DataFrame ({'Day': [1,2,3,4,5,6,7], 'Grocery': [30,80,45,23,51,46,76], 'Clothes' : [13,40,34,23,54,67,98], 'Utensili': [12,32,27,56,87,54,34]}, indice = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'Day', y = 'Clothes', kind = 'line', data = a) g.fig.autofmt_xdate ()

PRODUZIONE:

L'impostazione predefinita per il lineplot è y in funzione di x. Tuttavia, può essere modificato se lo desideri. Ci sono molte altre opzioni che puoi provare ulteriormente.

Ora diamo un'occhiata a come tracciare dati categoriali.

Tracciare con dati categoriali:

Questo approccio entra in gioco quando la nostra variabile principale viene ulteriormente suddivisa in gruppi discreti (categoriali). Ciò può essere ottenuto utilizzando la funzione catplot ().

catplot ():

Questa è una funzione a livello di figura come relplot (). Può essere caratterizzato da tre famiglie di funzioni a livello di assi e precisamente:

  1. Scatterplots - Questi includono stripplot (), swarmplot ()

  2. Diagrammi di distribuzione - che sono boxplot (), violinplot (), boxenplot ()

  3. Stima grafici - vale a dire pointplot (), barplot (), countplot ()

Facciamo ora alcuni esempi per dimostrarlo:

ESEMPIO:

importa seaborn come sns importa matplotlib.pyplot come plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', dati = a)

PRODUZIONE:

Come puoi vedere, nell'esempio sopra non ho impostato il parametro 'kind'. Pertanto ha restituito il grafico come grafico a dispersione predefinito. È possibile specificare una qualsiasi delle funzioni di livello degli assi per modificare il grafico secondo necessità. Facciamo anche un esempio di questo:

ESEMPIO:

importa seaborn come sns importa matplotlib.pyplot come plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', tipo = 'violino', dati = a)

PRODUZIONE:

L'output sopra mostra il violinplot per il set di dati dei suggerimenti. Ora proviamo a trovare come visualizzare la distribuzione di un set di dati.

Visualizzazione della distribuzione di un set di dati:

Questo fondamentalmente si occupa della comprensione dei set di dati con il contesto per essere univariati o bivariati. Prima di iniziare con questo, importa quanto segue:

importa numpy come np importa panda come pd importa seaborn come sns importa matplotlib.pyplot come plt da scipy importa stats sns.set (color_codes = True)

Fatto ciò, puoi continuare a tracciare distribuzioni univariate e bivariate.

Tracciare distribuzioni univariate:

Per tracciarli, puoi usare la funzione distplot () come segue:

ESEMPIO:

a = np.random.normal (loc = 5, size = 100, scale = 2) sns.distplot (a)

PRODUZIONE:

Come puoi vedere nell'esempio sopra, abbiamo tracciato un grafico per la variabile a i cui valori sono generati dalla funzione normal () usando distplot.

Tracciare distribuzioni bivariate:

Questo viene visualizzato quando si hanno due variabili indipendenti casuali che danno luogo a un evento probabile. La funzione migliore per tracciare questo tipo di grafici è jointplot (). Tracciamo ora un grafico bivariato usando jointplot ().

ESEMPIO:

x = pd.DataFrame ({'Day': [1,2,3,4,5,6,7], 'Grocery': [30,80,45,23,51,46,76], 'Clothes' : [13,40,34,23,54,67,98], 'Utensili': [12,32,27,56,87,54,34]}, indice = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'Day': [8,9,10,11,12,13,14], 'Grocery': [30,80,45,23,51,46, 76], 'Vestiti': [13,40,34,23,54,67,98], 'Utensili': [12,32,27,56,87,54,34]}, indice = [8,9 , 10,11,12,13,14]) media, cov = [0, 1], [(1, .5), (.5, 1)] data = np.random.multivariate_normal (mean, cov, 200 ) con sns.axes_style ('white'): sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

PRODUZIONE:

Ora che hai compreso le varie funzioni di Python Seaborn, passiamo alla creazione di griglie multi-trama strutturate.

Griglie multi-grafico:

Python Seaborn ti consente di tracciare più griglie fianco a fianco. Questi sono fondamentalmente diagrammi o grafici che vengono tracciati utilizzando la stessa scala e gli stessi assi per facilitare il confronto tra di loro. Questo, a sua volta, aiuta il programmatore a distinguere rapidamente tra i grafici e ottenere grandi quantità di informazioni.

Considera il seguente esempio di funzione facetgrid () per tracciare questi grafici.

ESEMPIO:

sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'species') b.map (plt.hist, 'sepal_length')

PRODUZIONE:

L'output sopra mostra chiaramente il confronto tra i suggerimenti che vengono dati durante il pranzo e la cena. Puoi anche tracciare usando la funzione PairGrid quando hai una coppia di variabili da confrontare. Considera il seguente esempio.

ESEMPIO:

sns.set (style = 'ticks') a = sns.load_dataset ('flight') b = sns.PairGrid (a) b.map (plt.scatter)

PRODUZIONE:

Come puoi vedere, l'output di cui sopra confronta chiaramente l'anno e il numero di passeggeri in modi diversi.

Seaborn consente anche personalizzazioni per quanto riguarda l'estetica che viene discussa ulteriormente.

Trama-Estetica:

Questo segmento del tutorial di Python Seaborn si occupa di rendere le nostre trame più attraenti e piacevoli.

Python Seaborn Figure-Estetica:

La prima funzione di cui parlerò è set (). Ho già utilizzato il parametro 'style' di questa funzione. Questo parametro tratta fondamentalmente i temi del mare. Al momento, ce ne sono cinque disponibili: darkgrid, ticks, whitegrid, white e dark.

Considera il seguente esempio che mostra il tema bianco.

ESEMPIO:

importa seaborn come sns importa matplotlib.pyplot come plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', dati = a)

PRODUZIONE:

Nell'output sopra, puoi notare che il tema è cambiato in bianco. Puoi esplorarli ulteriormente utilizzando anche gli altri temi. Se noti nell'output precedente, ci sono assi presenti tutto intorno al grafico. Tuttavia, questo è anche personalizzabile utilizzando la funzione despine (). Guarda l'esempio qui sotto.

ESEMPIO:

importa seaborn come sns importa matplotlib.pyplot come plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', data = a) sns.despine (offset = 10, trim = True)

PRODUZIONE:



Notare la differenza tra le due uscite precedenti. Tuttavia, ci sono molte altre opzioni che puoi esplorare da solo.

Tavolozze di colori Python Seaborn:

Il colore è fondamentalmente la caratteristica che si avvicina agli occhi umani al di là di qualsiasi altra caratteristica. Seaborn ti permette di giocare con i colori usando varie funzioni come color_palette (), hls_palette (), husl_palette (), ecc. Dai un'occhiata ai colori che sono attualmente presenti in seaborn.

ESEMPIO:

importa numpy come np importa seaborn come sns importa matplotlib.pyplot come plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)

PRODUZIONE:

L'immagine sopra mostra i colori presenti in Seaborn. L'ho fatto usando la funzione palplot (). Per variazioni più profonde, puoi usare hls_palette (), husl_palette (), ecc.

Questo ci porta alla fine del tutorial di Python Seaborn. Spero tu abbia capito tutto chiaramente. Assicurati di esercitarti il ​​più possibile .

Hai domande per noi? Per favore, menzionalo nella sezione commenti di questo blog 'Python Seaborn Tutorial' e ti risponderemo il prima possibile.

Per ottenere una conoscenza approfondita di Python e delle sue varie applicazioni, puoi iscriverti a live con supporto 24 ore su 24, 7 giorni su 7 e accesso a vita.