Paràmetres estadístics

Un cop tenim les dades endreçades en una taula, en el cas de les variables quantitatives interessa buscar-ne alguns paràmetres que ens aportin informació a partir d'un sol nombre.

Hi ha paràmetres de molts tipus: de centralització, de dispersió, de simetria, de curtosis, etc, però ens centrarem bàsicament en els dos primers tipus.

Mesures de centralització

Ens indiquen on es situen els valors centrals de la distribució. Les principals són:

NOM COM ES CALCULA
Mitjana aritmètica Oberstrich eingeschlossen X Error converting from MathML to accessible text.
És el valor que tindrien les dades si totes fossin iguals i sumessin el mateix.
Mediana Me

Si la N és senar Me = dada que ocupa el lloc Error converting from MathML to accessible text.

Si la N és parell Me = mitjana de les dades que ocupen el lloc  Error converting from MathML to accessible text.

És el valor que està just al mig de la distribució. La meitat de dades són iguals o superiors a la mediana i la meitat menors o iguals.

Moda Mo És la dada que té més freqüència, és a dir la que més és repeteix

Convé molt que llegeixis amb deteniment els detalls i exemples que trobaràs en aquest document, sobretot fixa't molt bé en la interpretació de cada paràmetre: Mesures de centralització. 

Mesures de dispersió

Fixa't en aquestes dues distribucions de dades:

A:1, 4, 4, 9.

B:  4, 4, 4, 4, 4, 5, 5, 6

En el cas A: la Mo=4, la Me=4 i la Oberstrich eingeschlossen X= 4,5.

En el cas B: la Mo=4, la Me=4 i la Oberstrich eingeschlossen X= 4,5.

Observa que coincideixen els tres paràmetres de centralització, en canvi a cop d'ull es veu que es tracta de dues distribucions prou diferents. Això ens fa pensar que ens calen altres paràmetres per fer un bon estudi.

Les mesures de dispersió ens donen una idea del grau de separació de les dades de la distribució.

Aquí tenim les fórmules principals. És especialment important que recordeu i sapigueu aplicar la fórmula de la variància i de la desviació típica. Observeu que es donen dues fórmules alternatives pel càlcul de la variància. Convé saber les dues i utilitzar la que més convingui segons quines dades coneguem. A ser possible farem servir la segona opció, ja que això ens evitarà haver d'anar introduint parèntesis a la calculadora.

NOM COM ES CALCULA
Rang o recorregut R Error converting from MathML to accessible text.
Desviació mitjana Error converting from MathML to accessible text. Error converting from MathML to accessible text.
Variància   Error converting from MathML to accessible text.
Error converting from MathML to accessible text.

Desviació típica Error converting from MathML to accessible text.
Error converting from MathML to accessible text.


El coeficient de variació

El coeficient de variació serveix per comparar dues distribucions diferents. Ens indica quina de les distribucions té menys dispersió i per tant una mitjana més representativa.

Quan més petit és el CV menys dispersió i més representativitat té la mitjana aritmètica de la distribució.

Error converting from MathML to accessible text.  es calcula dividint la desviació típica entre la mitjana aritmètica.