Estadística descriptiva unidimensional

En aquest primer capítol del llibre, es recorden els principals conceptes de l'estadística unidimensional (és a dir, en la què s'estudia només una variable), per a poder posteriorment encarar l'estadística de dues variables o bidimensional. Si aquests conceptes ja els domines, pots passar directament al capítol 2.

Què és l'estadística?

Avui dia difícilment podem llegir un diari o veure un telenotícies sense trobar-nos gràfics i estudis estadístics. És important conèixer els conceptes bàsics d'aquesta ciència per entendre i interpretar críticament la informació que se'ns dóna.

L'estadística és una branca de les matemàtiques que té per objectiu recopilar, organitzar, analitzar i interpretar dades referides a un col·lectiu.

Primers conceptes

Convé conèixer el vocabulari específic que es fa servir en els estudis estadístics.

Població
: conjunt d'individus amb algunes característiques comunes sobre el què recau l'estudi. 

Mostra: subconjunt de la població sobre la què es fa l'estudi quan és impossible fer l'estudi exhaustiu sobre tota la població. La mostra cal que sigui representativa de tota la població, per tal que se'n puguin extraure resultats fiables.Quan més gran sigui la mostra, més fiable seran els resultats.

Variable estadística: és la propietat o característica de la població que estem interessats a estudiar. Es solen representar per lletres majúscules X, Y, Z...Hi ha molts tipus de variables i convé començar classificant-les segons diferents criteris.

Les dades són els valors concrets que pren aquesta variable estadística.

Exemple

Si fem un estudi sobre el nombre de germans que tenen els estudiants de Batxillerat a l'IOC, podríem passar una enquesta demanant quants germans té cada estudiant.

La població estaria formada per tots els estudiants de Batxillerat de l'IOC.

Una mostra podria estar formada per 100 estudiants agafats de forma aleatòria. És important el fet que estem dient que sigui aleatòria, perquè si per exemple fem l'estudi amb una mostra formada pels alumnes de l'IOC que no són majors d'edat, el resultat quedaria alterat perquè aquesta mostra no seria representativa.
La variable en aquest cas seria el nombre de germans que té cada estudiant.
I les dades serien els resultats concrets: 0 germans, 1 germà, 2 germans, etc que respongués cada estudiant a la consulta.

 

Classificació de les dades

Les variables estadístiques poden ser de diferent naturalesa segons com són les dades que s'obtenen, per això és important fer-ne una classificació i aquesta es pot fer segons diversos criteris. 

Si les classifiquem segons si les dades es poden o no comptar parlarem de  variables estadístiques quantitatives i qualitatives.

  • Les variables qualitatives prenen valors no numèrics, que no es poden mesurar. Dins d'aquest tipus encara podem separar les variables ordinals tals que tot i no ser numèriques podrien ser ordenades (per exemple molt, bastant, suficientment, poc, gens) i les nominals que són atributs que no poden ser ordenats (colors, nacionalitats, etc)
  • Les variables quantitatives prenen valors numèrics, les podem mesurar. Entre elles, distingim dos tipus: discretes i contínues.

- Les variables quantitatives discretes no poden prendre valors intermedis entre dos valors possibles consecutius.

- Les variables quantitatives contínues poden prendre valors intermedis entre dos valors tan propers com vulguem.

Exemples
  • Sigui X la variable estadística que estudia el color del cotxe dels ciutadans d'una certa població. Aquesta variable pot prendre els valors 

X={blanc, vermell, blau, verd, groc, negre,...} i és una variable qualitativa.


  • Sigui Y la variable estadística que estudia la llargada de les erugues de les diferents espècies de papallones d'un determinat continent. Aquesta variable pot prendre qualsevol nombre real que està dins l'interval [0'5, 10] cm.
Es tracta d'una variable quantitativa contínua.


  • Sigui Z la variable estadística que estudia el nombre de vegades que van al cinema mensualment els habitants d'una ciutat. Aquesta variable pot prendre els valors

Z={0, 1, 2, 3, 4, ....} i és una variable quantitativa discreta, observeu que entre 1 i 2 la variable no pot prendre els valors decimals intermedis, perquè no podem anar al cinema 1,3 vegades.

 

La classificació anterior la podem resumir en aquest quadre:

Es recomana consultar el document Conceptes bàsics d'estadística unidimensional (pag 1-2) on trobareu exemples i explicacions més detallades d'aquests primers conceptes.