Llibre d'estadística

lloc: CFA Jacint Carrió i Vilaseca
Curs: Aula d'autoaprenentatge de matemàtiques
Llibre: Llibre d'estadística
Imprès per: Guest user
Data: dissabte, 21 de març 2026, 21:27

Descripció

Llibre d'estadística

Estadística, poblacions i variables

L'ESTADÍSTICA és la ciència que proporciona mètodes per classificar, analitzar i interpretar dades procedents d'observacions de col·lectivitats o de fenòmens col·lectius (de caràcter social, econòmic, mèdic, tecnològic, etc ...).

L'ESTADÍSTICA es divideix en dues branques:

1) Estadística DESCRIPTIVA. Proporciona:

  • Mètodes per ordenar, agrupar, classificar i representar les dades
  • Característiques numèriques que permeten resumir les dades amb la intenció de condensar-les amb la màxima claredat i mínima pèrdua d'informació.

    Exemple: els censos de població que es realitzen periòdicament i que permeten fer estudis de sexes, edats, nivells d'estudis, ingressos, etc. sobre el total d'habitants d'una població, comunitat, estat , etc.

2) Estadística INFERENCIAL:

  • Conjunt de tècniques que permeten treure conclusions sobre tot un col·lectiu (població) a partir d'un coneixement parcial d'aquest (mostra).

    L'estadística inferencial s'aplica quan és impossible accedir a tota una població per la raó que sigui (manca de recursos, manca de temps, impossibilitat física de fer-ho, etc.)

    Exemple: els estudis d'audiència televisiva que a partir d'un sondeig d'opinió d'un grup reduït de ciutadans, calculen (amb un cert marge d'error que haurien de donar), percentatges d'audiència pel total de televidents.

Per altra part, una VARIABLE ESTADÍSTICA és tota característica que vulguem observar o mesurar sobre els individus d'una població. Segons el nombre variables que tinguem en compte en una mateixa població, tindrem:

  • Estadístiques UNIVARIANTS, si només tenim en compte una variable (per exemple, el pes d'una persona)
  • Estadístiques MULTIVARIANTS, si tenim en compte més d'una variable (per exemple, sexe, altura, pes i envergadura d'una persona). En particular, si tenim en compte dues variables, tindrem estadístiques BIVARIANTS.

POBLACIÓ és el conjunt total de persones o objectes dels que desitgem obtenir informació per fer un estudi estadístic. El sentit estadístic de la paraula POBLACIÓ no sempre (casi mai) coincideix amb el seu sentit usual.

Una MOSTRA és un subconjunt d’una població que s’utilitza per inferir resultats per a tota la població, una mostra ha de ser significativa.

INDIVIDU o UNITAT ESTADÍSTICA és qualsevol element de la població o mostra. És la unitat més simple subjecte a observació.

La MIDA de la població o de la mostra és el número d'individus que la formen.

VARIABLE ESTADÍSTICA és tota característica que vulguem observar o mesurar sobre els individus d'una població o mostra. En ocasions es parla de DADES ESTADÍSTIQUES per referir-nos als valors que pren una variable pels diferents elements de la població o mostra.

SÈRIE ESTADÍSTICA UNIDIMENSIONAL és tota successió de valors d'una variable observats o mesurats en els individus d'una població o mostra.

Exemple :

Els pesos dels estudiants d'una classe són en Kg,

56

58.5

60

57

58

66.5

58.5

56.5

63

66

65.5

58.5

64.5

59

58.5

56.5

62.5

60.5

56.5

63.5

73

68

61

59.5

63

68

66

64.5

64.5

57

Està clar que l'estudi s'ha fet sobre 30 alumnes, només cal comptar. Aleshores:

  • Si a l'estudi estadístic només ens interessa treure conclusions sobre aquesta classe, aquests 30 alumnes són la població.
  • Si volem utilitzar els pesos d'aquests 30 alumnes per treure conclusions sobre, per exemple, tots els alumnes del centre d'estudis, aquests 30 alumnes són una mostra.

Tant si es tracta de població com de mostra, cada alumne és un individu de l'estudi estadístic, i la mida de la població o de la mostra és 30.

La variable estadística que s'estudia és el pes, que pren valors numèrics, i la sèrie estadística és la successió de pesos 56, 58.5, 60, ... de la taula inicial.

Taules de freqüències

Es diu freqüència a la quantitat de vegades que es repeteix un determinat valor d'una variable aleatòria en una mostra o població estadística. Aquest valor de la variable aleatòria sol identificar-se amb un esdeveniment o succés, el qual ocorre durant la realització d'un experiment o estudi d'un aspecte o característica d'interès de la mostra o població.

Tipus de freqüències

En estadística es poden distingir fins a quatre tipus de freqüència, que són:

  • Freqüència absoluta n subíndex i d'una variable estadística  X subíndex i és el nombre de vegades que apareix en la mostra el valor  x subíndex i. El total de la suma de les freqüències absolutes de cada valor x subíndex i és igual al nombre total  N d'ocurrències que componen la mostra estudiada.
  • Freqüència relativa f subíndex i és el quocient que expressa la proporció entre la freqüència absoluta n subíndex i de cada valor  x subíndex i i la mida  N de la mostra. És a dir, f subíndex i igual fracció n subíndex i entre N igual fracció numerador n subíndex i entre denominador sumatori subíndex blanc n subíndex i fi fracció.

La suma de les freqüències relatives és 1: sumatori subíndex blanc f subíndex i igual 1.

Com que la freqüència relativa és una proporció, es pot expressar en forma de percentatge o tant per cent p subíndex isi multipliquem per 100.

  • Freqüència absoluta acumulada N subíndex i és el nombre de vegades que apareixen en la mostra tant el valor  x subíndex i com els valors inferiors a ell. L'última freqüència absoluta acumulada ha de ser igual a N.
  • Freqüència relativa acumulada F subíndex i és el quocient entre la freqüència absoluta acumulada i el nombre total  N d'ocurrències. És a dir, F subíndex i igual fracció N subíndex i entre N.

Multiplicant la freqüència relativa acumulada per 100 s'obté el percentatge acumulat P subíndex i. De manera anàloga a N subíndex i, el darrer valor de F subíndex i és 1 i el de P subíndex iés 100%.

 

Totes aquestes freqüències es representen en una taula.

 

  

En aquests vídeos trobaràs exemples de com construir una taula de freqüències.

Notaràs que els símbols de les diferents freqüències són diferents:

  • Freqüència absoluta f subíndex i
  • Freqüència absoluta acumulada F subíndex i
  • Freqüència relativa h subíndex i
  • Freqüència relativa acumulada H subíndex i

  

 

Gràfics estadístics

 

 

Mesures de centralització

Un cop hem recollit les dades i les hem ordenat posant-les en una taula, arriba el moment de calcular algunes mesures que ens ajudin a fer un bon anàlisi de la variable d'estudi.

Amb dades de tipus quantitatiu les mesures de centralització ens proporcionen amb un sol valor quin és el centre de la distribució a l'entorn del qual estan les dades.

Anem a definir les mesures de centralització més importants.

MODA: És el valor que més es repeteix. Si tenim les dades agrupades en una taula buscarem la dada que té més freqüència absoluta o relativa. Pot ser que una distribució de dades no tingui moda, o que en tingui més d'una (si en té dues li direm bimodal)

MITJANA ARITMÈTICA: És la suma de totes les dades dividida entre el nombre total de dades. De forma abreujada l'escrivim com una x amb una barra a dalt : x amb barra a sobre. Si tenim N dades, la mitjana es calcula amb la següent fórmula: x amb barra a sobre igual fracció numerador sumatori subíndex blanc x subíndex i entre denominador N fi fracció. Si tenim moltes dades repetides multiplicarem cada dada per la seva freqüència per no haver de sumar tant, en aquest cas la fórmula ens quedarà: x amb barra a sobre igual fracció numerador sumatori subíndex blanc x subíndex i per n subíndex i entre denominador N fi fracció.

MEDIANA : És el valor central de la distribució de dades. El 50% de les dades són inferiors o iguals a la mediana i l'altre meitat són superiors a ella. Per calcular-la han d'estar ordenades de petita a gran. Si tenim un nombre senar de dades n'hi haurà una que està justament al mig, la que ocupa el lloc fracció numerador N més 1 entre denominador 2 fi fracció, aquesta dada en serà la mediana. Si tenim un nombre parell de dades, n'hi ha dues que ocupen el centre, les que estan en posició fracció N entre 2i la que està en posició fracció N entre 2 més 1 . Es tractarà d'identificar quines dades estan en aquestes posicions i després fer la mitjana de les dues.

 

Exemple1

El trimestre de tardor es van presentar 412 alumnes a la prova de matemàtiques. Les notes finals d'aquests estudiants presentats queden recollides a la següent taula.

x subíndex i

n subíndex i

N subíndex i

1

21

21

2

44

65

3

26

91

4

8

99

5

50

149

6

76

225

7

69

294

8

75

369

9

36

405

10

7

412

 

A partir d'aquestes dades volem calcular la moda, la mediana i la mitjana aritmètica.

Abans de fer els càlculs recordem que vol dir cada columna.

A la primera columna hi tenim les dades x subíndex i és a dir el ventall de notes obtingudes.

A la segona columna hi tenim les freqüències absolutes n subíndex i, és a dir el nombre d'alumnes que han obtingut cadascuna de les notes. (21 alumnes han tret un 1; 44 alumnes tenen un 2; ....)

I a la tercera columna hi tenim les freqüències absolutes acumulades N subíndex i, fixem-nos que aquesta columna s'obté de sumar les n subíndex i. Així la primera N subíndex 1 coincideix amb n subíndex 1, la segona N subíndex 2 l'obtenim sumant n subíndex 1 més n subíndex 2N subíndex 3 igual n subíndex 1 més n subíndex 2 més n subíndex 3; etc.

Aclarits aquests termes anem pels càlculs demanats.

 

Quina és la moda?

És la nota que han obtingut més alumnes , per tant és la que té més freqüència absoluta. En aquest cas es tracta del 6 que l'han obtingut 76 alumnes.

 

Quina és la mitjana aritmètica?

Apliquem la fórmula

envoltori superior x igual fracció numerador sumatori subíndex blanc x subíndex i per n subíndex i entre denominador N fi fracció igual fracció numerador 1 per 21 més 2 per 44 més 3 per 26 més 4 per 8 més 5 per 50 més 6 per 76 més 7 per 69 més 8 per 75 més 9 per 36 més 10 per 7 entre denominador 412 fi fracció igual fracció 2402 entre 412 igual 5 coma 83

Així doncs la nota mitjana obtinguda pels alumnes presentats a matemàtiques el trimestre de tardor va estar de 5,83 punts.

 

Quina és la mediana?

Ara tenim 412 dades, un nombre parell. Però no les anem a posar una al costat de l'altre per saber quina és la que ocupa el lloc fracció N entre 2 igual fracció 412 entre 2 igual 206 espai normal i espai 207. Hem de fer-ho observant la taula, concretament la columna de les freqüències absolutes acumulades. Tenim 149 dades inferiors o iguals a 5, i 225 inferiors o iguals a 6. Per tant tant la dada que ocupa el lloc 206 com la 207 són un 6. No cal fer la mitjana perquè són iguals i per tant podem afirmar que la mediana és 6.

El 50% dels alumnes presentats tenen un 6 o menys i l'altra 50% més d'un 6.

 
Exemple 2

Es vol fer un estudi sobre el consum d'alcohol entre els joves. Es pregunta a 200 nois i noies de 16 anys quants cops a la setmana beuen alcohol. Les respostes queden recollides a la següent taula:

x subíndex i

n subíndex i

N subíndex i

0

60

60

1

40

100

2

60

160

3

30

190

4

10

200

Volem calcular-ne la moda la mitjana i la mediana.

  

Quina és la moda?

En aquest cas podem observar que hi ha dos valors que tenen freqüència màxima 0 i 2. Per tant podríem dir que es tracta d'una distribució bimodal, és a dir té dues modes 0 i 2.

 

Quina és la mitjana aritmètica?

Apliquem la fórmula  envoltori superior x igual fracció numerador sumatori subíndex blanc x subíndex i per n subíndex i entre denominador N fi fracció igual fracció numerador 0 per 60 més 1 per 40 més 2 per 60 més 3 per 30 més 4 per 10 entre denominador 200 fi fracció igual fracció 290 entre 200 igual 1 coma 45

Per tant direm que la mitjana de la distribució és 1,45.


 

Quina és la mediana?

Com tenim 200 dades , haurem de buscar les que ocupen el lloc 100 i 101 un cop ordenades de petita a gran. Com tenim la taula, és fàcil veure a la tercera columna, la de les freqüències acumulades que les dades nº 61 fins a la nº 100 (incloses) corresponen a un 1, i que des de la dada 101 fins a la 160 corresponen a un 2.

Per tant la dada nº 100 és 1 i la dada nº 101 és un 2. Per calcular la mediana fem la mitjana de les dues : Mediana= fracció numerador 1 més 2 entre denominador 2 fi fracció igual fracció 3 entre 2 igual 1 coma 5 

La Mediana és 1,5 i per tant la meitat dels joves enquestats beuen alcohol 1,5 cops a la setmana o menys.

 

Vídeo 1. Càlcul de la mitjana aritmètica.

Vídeo 2. Càlcul de la mediana.

Vídeo 3. Freqüència, Mitjana, Moda i Mediana.

Exemple de dades agrupades en intervals o classes

Si la variable és contínua, o el nombre de valors diferents de la variable és molt elevat, convé elaborar una taula de freqüències i agrupar les dades en intervals o classes.
El punt mitjà de cada classe es denomina marca de classe i es designa com a xi.
Un cop distribuïdes les dades en intervals i calculades les marques de classe, la manera de procedir és anàloga a la de les variables discretes, amb la substitució de la totalitat de l’interval per la marca de classe.

Exemple:

Les dades de la taula corresponen a la venda de rentadores d’un establiment cada dia de l’últim mes.

2 7 8 10 9
17 13 5 14 16
12 20 14 9 10
19 4 6 16 15
18 12 17 22 0
22 0 24 13 7


a) Calcula el nombre mitjà de rentadores venudes en aquest període.
b) Esbrina’n la moda i la mediana.

Resolució:

Rentadores
venudes per dia
xi ni xi·ni Ni
[0, 5[ 2,5 4 10 4
[5, 10[ 7,5 7 52,5 11
[10, 15[ 12,5 8 100 19
[15, 20[ 17,5 7 122,5 26
[20, 25[ 22,5 4 90 30
Total 30 375

 

a) Com que les dades varien entre 0 i 24, per elaborar la taula de freqüències sembla raonable distribuir-les a les classes [0, 5[, [5, 10[, [10, 15[, [15, 20[ i [20, 25[. A la vista de la taula de freqüències, la venda mitjana de rentadores és:

x amb barra a sobre igual fracció numerador estil mostrar sumatori subíndex blanc x subíndex i per n subíndex i fi estil entre denominador N fi fracció igual fracció 375 entre 30 igual 12 coma 5

b) La classe modal és [10, 15[, amb freqüència 8. Per tant, la moda és Mo = 12,5.

El nombre de dades és 30, i la meitat és 15. La classe mediana és [10, 15[, ja que la seva freqüència absoluta acumulada excedeix per primera vegada la meitat de les dades. Prenem com a aproximació de la mediana la marca d’aquesta classe, Me = 12,5.

 

Estadística i full de càlcul

Fórmules bàsiques del full càlcul