Llibre d'estadística
| lloc: | CFA Jacint Carrió i Vilaseca |
| Curs: | Aula d'autoaprenentatge de matemàtiques |
| Llibre: | Llibre d'estadística |
| Imprès per: | Usuari convidat |
| Data: | dissabte, 21 de març 2026, 23:05 |
Descripció
Llibre d'estadística
Estadística, poblacions i variables
L'ESTADÍSTICA és la ciència que proporciona mètodes per classificar, analitzar i interpretar dades procedents d'observacions de col·lectivitats o de fenòmens col·lectius (de caràcter social, econòmic, mèdic, tecnològic, etc ...).
L'ESTADÍSTICA es divideix en dues branques:
1) Estadística DESCRIPTIVA. Proporciona:
- Mètodes per ordenar, agrupar, classificar i representar les dades
- Característiques numèriques que permeten resumir les dades amb la intenció de condensar-les amb la màxima claredat i mínima pèrdua d'informació.
Exemple: els censos de població que es realitzen periòdicament i que permeten fer estudis de sexes, edats, nivells d'estudis, ingressos, etc. sobre el total d'habitants d'una població, comunitat, estat , etc.
2) Estadística INFERENCIAL:
- Conjunt de tècniques que permeten treure conclusions sobre tot un col·lectiu (població) a partir d'un coneixement parcial d'aquest (mostra).
L'estadística inferencial s'aplica quan és impossible accedir a tota una població per la raó que sigui (manca de recursos, manca de temps, impossibilitat física de fer-ho, etc.)
Exemple: els estudis d'audiència televisiva que a partir d'un sondeig d'opinió d'un grup reduït de ciutadans, calculen (amb un cert marge d'error que haurien de donar), percentatges d'audiència pel total de televidents.
Per altra part, una VARIABLE ESTADÍSTICA és tota característica que vulguem observar o mesurar sobre els individus d'una població. Segons el nombre variables que tinguem en compte en una mateixa població, tindrem:
- Estadístiques UNIVARIANTS, si només tenim en compte una variable (per exemple, el pes d'una persona)
- Estadístiques MULTIVARIANTS, si tenim en compte més d'una variable (per exemple, sexe, altura, pes i envergadura d'una persona). En particular, si tenim en compte dues variables, tindrem estadístiques BIVARIANTS.
POBLACIÓ és el conjunt total de persones o objectes dels que desitgem obtenir informació per fer un estudi estadístic. El sentit estadístic de la paraula POBLACIÓ no sempre (casi mai) coincideix amb el seu sentit usual.
Una MOSTRA és un subconjunt d’una població que s’utilitza per inferir resultats per a tota la població, una mostra ha de ser significativa.
INDIVIDU o UNITAT ESTADÍSTICA és qualsevol element de la població o mostra. És la unitat més simple subjecte a observació.
La MIDA de la població o de la mostra és el número d'individus que la formen.
VARIABLE ESTADÍSTICA és tota característica que vulguem observar o mesurar sobre els individus d'una població o mostra. En ocasions es parla de DADES ESTADÍSTIQUES per referir-nos als valors que pren una variable pels diferents elements de la població o mostra.
SÈRIE ESTADÍSTICA UNIDIMENSIONAL és tota successió de valors d'una variable observats o mesurats en els individus d'una població o mostra.
Exemple :
Els pesos dels estudiants d'una classe són en Kg,
|
56 |
58.5 |
60 |
57 |
58 |
66.5 |
58.5 |
56.5 |
63 |
66 |
|
65.5 |
58.5 |
64.5 |
59 |
58.5 |
56.5 |
62.5 |
60.5 |
56.5 |
63.5 |
|
73 |
68 |
61 |
59.5 |
63 |
68 |
66 |
64.5 |
64.5 |
57 |
Està clar que l'estudi s'ha fet sobre 30 alumnes, només cal comptar. Aleshores:
- Si a l'estudi estadístic només ens interessa treure conclusions sobre aquesta classe, aquests 30 alumnes són la població.
- Si volem utilitzar els pesos d'aquests 30 alumnes per treure conclusions sobre, per exemple, tots els alumnes del centre d'estudis, aquests 30 alumnes són una mostra.
Tant si es tracta de població com de mostra, cada alumne és un individu de l'estudi estadístic, i la mida de la població o de la mostra és 30.
La variable estadística que s'estudia és el pes, que pren valors numèrics, i la sèrie estadística és la successió de pesos 56, 58.5, 60, ... de la taula inicial.
Taules de freqüències
Es diu freqüència a la quantitat de vegades que es repeteix un determinat valor d'una variable aleatòria en una mostra o població estadística. Aquest valor de la variable aleatòria sol identificar-se amb un esdeveniment o succés, el qual ocorre durant la realització d'un experiment o estudi d'un aspecte o característica d'interès de la mostra o població.
Tipus de freqüències
En estadística es poden distingir fins a quatre tipus de freqüència, que són:
- Freqüència absoluta
d'una variable estadística
és el nombre de vegades que apareix en la mostra el valor
. El total de la suma de les freqüències absolutes de cada valor
és igual al nombre total
d'ocurrències que componen la mostra estudiada.
- Freqüència relativa
és el quocient que expressa la proporció entre la freqüència absoluta
de cada valor
i la mida
de la mostra. És a dir,
.
La suma de les freqüències relatives és 1:
.
Com que la freqüència relativa és una proporció, es pot expressar en forma de percentatge o tant per cent
si multipliquem per 100.
- Freqüència absoluta acumulada
és el nombre de vegades que apareixen en la mostra tant el valor
com els valors inferiors a ell. L'última freqüència absoluta acumulada ha de ser igual a
.
- Freqüència relativa acumulada
és el quocient entre la freqüència absoluta acumulada i el nombre total
d'ocurrències. És a dir,
.
Multiplicant la freqüència relativa acumulada per 100 s'obté el percentatge acumulat
. De manera anàloga a
, el darrer valor de
és
1 i el de
és 100%.
Totes aquestes freqüències es representen en una taula.
En aquests vídeos trobaràs exemples de com construir una taula de freqüències.
Notaràs que els símbols de les diferents freqüències són diferents:
- Freqüència absoluta
- Freqüència absoluta acumulada
- Freqüència relativa
- Freqüència relativa acumulada
Gràfics estadístics
Mesures de centralització
Un cop hem recollit les dades i les hem ordenat posant-les en una taula, arriba el moment de calcular algunes mesures que ens ajudin a fer un bon anàlisi de la variable d'estudi.
Amb dades de tipus quantitatiu les mesures de centralització ens proporcionen amb un sol valor quin és el centre de la distribució a l'entorn del qual estan les dades.
Anem a definir les mesures de centralització més importants.
MODA: És el valor que més es repeteix. Si tenim les dades agrupades en una taula buscarem la dada que té més freqüència absoluta o relativa. Pot ser que una distribució de dades no tingui moda, o que en tingui més d'una (si en té dues li direm bimodal)
MITJANA ARITMÈTICA: És la suma de totes les dades dividida entre el nombre total de dades. De forma abreujada l'escrivim com una x amb una barra a dalt : . Si tenim
dades, la mitjana es calcula amb la següent fórmula:
. Si tenim moltes dades repetides multiplicarem cada dada per la seva freqüència per no haver de sumar tant, en aquest cas la fórmula ens quedarà:
.
MEDIANA : És el valor central de la distribució de dades. El 50% de les dades són inferiors o iguals a la mediana i l'altre meitat són superiors a ella. Per calcular-la han d'estar ordenades de petita a gran. Si tenim un nombre senar de dades n'hi haurà una que està justament al mig, la que ocupa el lloc , aquesta dada en serà la mediana. Si tenim un nombre parell de dades, n'hi ha dues que ocupen el centre, les que estan en posició
i la que està en posició
. Es tractarà d'identificar quines dades estan en aquestes posicions i després fer la mitjana de les dues.
Exemple1
El trimestre de tardor es van presentar 412 alumnes a la prova de matemàtiques. Les notes finals d'aquests estudiants presentats queden recollides a la següent taula.
|
|
|
|
|
1 |
21 |
21 |
|
2 |
44 |
65 |
|
3 |
26 |
91 |
|
4 |
8 |
99 |
|
5 |
50 |
149 |
|
6 |
76 |
225 |
|
7 |
69 |
294 |
|
8 |
75 |
369 |
|
9 |
36 |
405 |
|
10 |
7 |
412 |
A partir d'aquestes dades volem calcular la moda, la mediana i la mitjana aritmètica.
Abans de fer els càlculs recordem que vol dir cada columna.
A la primera columna hi tenim les dades és a dir el ventall de notes obtingudes.
A la segona columna hi tenim les freqüències absolutes , és a dir el nombre d'alumnes que han obtingut cadascuna de les notes. (21 alumnes han tret un 1; 44 alumnes tenen un 2; ....)
I a la tercera columna hi tenim les freqüències absolutes acumulades , fixem-nos que aquesta columna s'obté de sumar les
. Així la primera
coincideix amb
, la segona
l'obtenim sumant
;
; etc.
Aclarits aquests termes anem pels càlculs demanats.
Quina és la moda?
És la nota que han obtingut més alumnes , per tant és la que té més freqüència absoluta. En aquest cas es tracta del 6 que l'han obtingut 76 alumnes.
Quina és la mitjana aritmètica?
Apliquem la fórmula
Així doncs la nota mitjana obtinguda pels alumnes presentats a matemàtiques el trimestre de tardor va estar de 5,83 punts.
Quina és la mediana?
Ara tenim 412 dades, un nombre parell. Però no les anem a posar una al costat de l'altre per saber quina és la que ocupa el lloc . Hem de fer-ho observant la taula, concretament la columna de les freqüències absolutes acumulades. Tenim 149 dades inferiors o iguals a 5, i 225 inferiors o iguals a 6. Per tant tant la dada que ocupa el lloc 206 com la 207 són un 6. No cal fer la mitjana perquè són iguals i per tant podem afirmar que la mediana és 6.
El 50% dels alumnes presentats tenen un 6 o menys i l'altra 50% més d'un 6.
Exemple 2
Es vol fer un estudi sobre el consum d'alcohol entre els joves. Es pregunta a 200 nois i noies de 16 anys quants cops a la setmana beuen alcohol. Les respostes queden recollides a la següent taula:
|
|
|
|
|
0 |
60 |
60 |
|
1 |
40 |
100 |
|
2 |
60 |
160 |
|
3 |
30 |
190 |
|
4 |
10 |
200 |
Volem calcular-ne la moda la mitjana i la mediana.
Quina és la moda?
En aquest cas podem observar que hi ha dos valors que tenen freqüència màxima 0 i 2. Per tant podríem dir que es tracta d'una distribució bimodal, és a dir té dues modes 0 i 2.
Quina és la mitjana aritmètica?
Apliquem la fórmula
Per tant direm que la mitjana de la distribució és 1,45.
Quina és la mediana?
Com tenim 200 dades , haurem de buscar les que ocupen el lloc 100 i 101 un cop ordenades de petita a gran. Com tenim la taula, és fàcil veure a la tercera columna, la de les freqüències acumulades que les dades nº 61 fins a la nº 100 (incloses) corresponen a un 1, i que des de la dada 101 fins a la 160 corresponen a un 2.
Per tant la dada nº 100 és 1 i la dada nº 101 és un 2. Per calcular la mediana fem la mitjana de les dues : Mediana=
La Mediana és 1,5 i per tant la meitat dels joves enquestats beuen alcohol 1,5 cops a la setmana o menys.
Vídeo 1. Càlcul de la mitjana aritmètica.
Vídeo 2. Càlcul de la mediana.
Vídeo 3. Freqüència, Mitjana, Moda i Mediana.
Exemple de dades agrupades en intervals o classes
Si la variable és contínua, o el nombre de valors diferents de la variable és molt elevat, convé elaborar una taula de freqüències i agrupar les dades en intervals o classes.
El punt mitjà de cada classe es denomina marca de classe i es designa com a xi.
Un cop distribuïdes les dades en intervals i calculades les marques de classe, la manera de procedir és anàloga a la de les variables discretes, amb la substitució de la totalitat de l’interval per la marca de classe.
Exemple:
Les dades de la taula corresponen a la venda de rentadores d’un establiment cada dia de l’últim mes.
| 2 | 7 | 8 | 10 | 9 |
| 17 | 13 | 5 | 14 | 16 |
| 12 | 20 | 14 | 9 | 10 |
| 19 | 4 | 6 | 16 | 15 |
| 18 | 12 | 17 | 22 | 0 |
| 22 | 0 | 24 | 13 | 7 |
a) Calcula el nombre mitjà de rentadores venudes en aquest període.
b) Esbrina’n la moda i la mediana.
Resolució:
| Rentadores venudes per dia |
xi | ni | xi·ni | Ni |
| [0, 5[ | 2,5 | 4 | 10 | 4 |
| [5, 10[ | 7,5 | 7 | 52,5 | 11 |
| [10, 15[ | 12,5 | 8 | 100 | 19 |
| [15, 20[ | 17,5 | 7 | 122,5 | 26 |
| [20, 25[ | 22,5 | 4 | 90 | 30 |
| Total | 30 | 375 |
a) Com que les dades varien entre 0 i 24, per elaborar la taula de freqüències sembla raonable distribuir-les a les classes [0, 5[, [5, 10[, [10, 15[, [15, 20[ i [20, 25[. A la vista de la taula de freqüències, la venda mitjana de rentadores és:
b) La classe modal és [10, 15[, amb freqüència 8. Per tant, la moda és Mo = 12,5.
El nombre de dades és 30, i la meitat és 15. La classe mediana és [10, 15[, ja que la seva freqüència absoluta acumulada excedeix per primera vegada la meitat de les dades. Prenem com a aproximació de la mediana la marca d’aquesta classe, Me = 12,5.