1. Estadística Bidimensional

1.1. Rectes de regressió

En una distribució bidimensional, una vegada constatada la correlació lineal entre les dues variables, mitjançant el coeficient de correlació lineal de Pearson (r) es poden fer estimacions, és a dir prediccions de valors possibles d'una variable.

Per fer aquestes prediccions, s'ha de calcular una recta de regressió.

Hi ha dues rectes de regressió:

La de Y sobre X        
   y menys y amb barra a sobre igual fracció sigma subíndex x y fi subíndex entre sigma subíndex x al quadrat per obre parèntesis x menys x amb barra a sobre tanca parèntesis     
La de X sobre Y    x menys x amb barra a sobre igual fracció sigma subíndex x y fi subíndex entre sigma subíndex y al quadrat per obre parèntesis y menys y amb barra a sobre tanca parèntesis

La utilització d'una o l'altra depèn del context del problema. En ocasions l'enunciat ja diu quina recta utilitzar. En altres ocasions cal deduir-ho en funció de les dades.

Si es demana predir un valor de y donat el valor de x, cal usar la recta de Y sobre X, ja que és la recta en la que queda aïllada la Y.

Si es demana predir el valor de x coneixent la y corresponent, cal usar la recta de regressió de X sobre Y, ja que és la recta en la que queda aïllada la X.

La recta de regressió correspon a la recta que millor s'ajusta a la distribució de punts (núvol de punts). Gràficament es pot veure en aquest exemple de la distribució bidimensional d'aquest notes:

En aquest vídeo trobareu un exemple de com es calcula la recta de regressió de Y sobre X: