Concetti

Si dice popolazione l'insieme delle unità di interesse. Osservandole per intero, processo detto censimento, si possono trovare delle caratteristiche numeriche associate, chiamate parametri.

In alternativa si può cercare la stima attraverso una statistica, ovvero una funzione applicata ad un sottoinsieme della popolazione detto campione, definita anche stimatore perchè stima il valore di .

L'errore fra e può dipendere da errori campionari inevitabili, dovuti dalla dimensione del campione, o da errori non campionari evitabili, dovuti dall'uso di un campione o di uno stimatore inappropriato.

Per evitare gli errori non campionari si può effettuare un campionamento casuale semplice, estraendo le unità dalla popolazione in maniera casuale e indipendente, risultando in osservazioni che sono variabili casuali indipendenti e identicamente distribuite (i.i.d.), cioè indipendenti e aventi la stessa distribuzione.

Le statistiche campionarie sono una variabile casuale quando calcolate su un campione casuale e stimano un parametro di popolazione come media, mediana, quantili, varianza, etc.

Distorsione

Uno stimatore, anch'esso indicato da , si dice non distorto se: altrimenti la sua distorsione si può ricavare con .

Consistenza

Uno stimatore su un campione grande si dice consistente se1: ovvero se almeno asintoticamente per la distorsione e la varianza convergono a zero.

Normalità asintotica

Uno stimatore è asintoticamente normale se al crescere di approssima la distribuzione normale, cioè2:

Trasformazioni

  • sse è continua
  • sse

Errore standard

Assieme allo stimatore si considera anche un suo indice di qualità, cioè il suo errore standard: dove è la deviazione standard di , così che sia esplicito quanto varia al cambiare del campione.

L'effetto che ha si può notare da: Confronto tra stimatori

Precisione e accuratezza

Uno stimatore si dice che ha più precisione quando è meno variabile, e si dice che ha più accuratezza quando è meno distorto. Entrambe le proprietà sono rappresentate dall'errore quadratico medio:

Di conseguenza, se due stimatori sono non distorti si preferisce quello con varianza inferiore, altrimenti se anche uno o entrambi sono distorti si sceglie quello con l'errore quadratico medio minore.