Analisi grafiche

Attraverso i grafici si possono ricavare modelli probabilistici e statistici sui dati e osservazioni anomale.

Come esempio, si considera il campione precedente.

Istogrammi

Gli istogrammi permettono di visualizzare la forma di distribuzione, dividendo il range dei dati nelle ascisse in intervalli chiamati bins e rappresentando nelle ordinate il valore della:

  • Frequenza: il numero di osservazioni che appartengono ad ogni bin
  • Frequenza relativa: la percentuale di osservazioni in ogni bin

Nell'esempio, usando intervalli larghi :

Istogramma di frequenza e di frequenza relativa

Grafici a scatola

I grafici a scatola, o boxplot, visualizzano la stima delle posizioni e della variabilità della popolazione:

Significato rappresentazioni del grafico a scatola

Nell'esempio, con la media rappresentata da una , si può notare il valore anomalo :

Grafico a scatola

Grafici a dispersione

I grafici a dispersione servono a comprendere la relazione tra due variabili.

Se ci sono più valori sullo stesso si tende a spostarli leggermente, in modo che non si sovrappongano.

Per esempio, senza spostarli:

Grafico a dispersione dei virus trovati da antivirus all'avvio