sábado, 23 de mayo de 2009

DIGRAMA DE CAJAS

Diagrama de caja (Box-Plot)

Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la caja, y dos brazos, los bigotes.

Es un gráfico que se suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y simetría de la distribución.

Como dibujarlo

                            +-----+-+ 
* o |-------| | |---|
+-----+-+

+---+---+---+---+---+---+---+---+---+---+---+---+
0 1 2 3 4 5 6 7 8 9 10 11 12
  • Ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles Q1, Q2 y Q3 y el rango intercuartil (IQR)

En el ejemplo: Valor 7: es el Q1 (25% de los datos) Valor 8.5: es el Q2 o mediana (el 50% de los datos) Valor 9: es el Q3 (75% de los datos) Rango intercuartil IQR (Q3-Q1)=2

  • Dibujar un rectángulo con Q1 y Q3 como extremos e indicar la posición de la mediana (Q2) mediante una línea.
  • Para dibujar los bigotes, las líneas que se extienden desde la caja, hay que calcular los límites superior e inferior, Li y Ls, que identifiquen a los valores atípicos.

Para ello se calcula cuando se consideran atípicos los valores. Son aquellos inferiores a Q1-1.5*IQR o superiores a Q3+1.5*IQR. En el ejemplo: inferior: 7-1.5*2=4 superior: 9+1.5*2=12 Ahora se buscan los úl

timos valores que NO son atípicos, que serán los extremos de los bigotes. En el ejemplo: 5 y 10

  • Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).

En el ejemplo: 0.5 y 3.5 Pero además



se puede

n considerar valores extremadamente atípicos a los que exceden Q1-3*IQR o Q3+3*IQR. De tal modo que, en el ejemplo: inferior: 7-3*2=1 superior: 9+3*2=15 El valor 0.5 seria atípico extremo y 3.5 sería atípico


LOS DIAGRAMAS DE CAJAS Y BIGOTES

Los diagramas de cajas y bigotes –también llamados boxplots o box and whiskers – son representaciones gráficas de una distribución estadística unidimensional en las que se reflejan cinco parámetros: límite inferior, primer cuartil, mediana, tercer cuartil y límite superior. A partir de estos cinco parámetros se pueden obtener fácilmente otros dos: el rango y el rango intercuartílico. Además, también dan una medida de la simetría o asimetría de la distribución, del sesgo y de la dispersión.
Se observa que:
1. El bigote de la izquierda es algo más corto que el de la derecha, lo que indica que las calificaciones de la cuarta parte más baja de la clase están algo más concentradas que las calificaciones de la cuarta parte que las tienen más altas.
2. También se observa que la parte izquierda de la caja, que corresponde a los alumnos que han obtenido calificaciones entre el 25% y el 50% es menor que la de la derecha, lo que indica que las calificaciones de estos últimos alumnos están más dispersas.
3. Es fácil ver que el rango es: Ls - Li = 9 – 3 = 6

Y el rango intercuartílico es: Q3 -

Q1=6,5– 4,5 = 2

También se observa que la distribución es asimétrica y ligeramente sesgada hacia la

derecha.


No hay comentarios:

Publicar un comentario