Bioestadística
 

.


 
 
Parámetros de dispersión.
En este apartado se estudia la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o dispersos alrrededor del valor central.

Existen diversas medidas de dispersión , entre las más utilizadas podemos destacar las siguientes:
1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo.

2.- Varianza: promedia la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las difrencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.

La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

3.- Desviación típica: es la raíz cuadrada de la varianza. Posee las mismas unidades que la media.

4.- Coeficiente de variación de Pearson: es el cociente entre la desviación típica y la media. Es un parametro adimensionl y permite comparar series de distintas medias.

Ejemplo: vamos a utilizar la serie de datos de la estatura de los alumnos de una clase, como ya es habitual, y vamos a calcular sus medidas de dispersión.
 

Variable
Frecuencias absolutas
Frecuencias relativas
(Valor)
Simple
Acumulada
Simple
Acumulada
x x x x x
1,20
1
1
3,3%
3,3%
1,21
4
5
13,3%
16,6%
1,22
4
9
13,3%
30,0%
1,23
2
11
6,6%
36,6%
1,24
1
12
3,3%
40,0%
1,25
2
14
6,6%
46,6%
1,26
3
17
10,0%
56,6%
1,27
3
20
10,0%
66,6%
1,28
4
24
13,3%
80,0%
1,29
3
27
10,0%
90,0%
1,30
3
30
10,0%
100,0%

1.- Rango: Diferencia entre el mayor valor de la muestra (1,30) y el menor valor (1,20). Luego el rango de esta muestra es 10 cm.

2.- Varianza: recordemos que la media de esta muestra es 1,253. Luego, aplicamos la fórmula:

Por lo tanto, la varianza calculada para esta serie es 0,0010

3.- Desviación típica: es la raíz cuadrada de la varianza.

Luego:

4.- Coeficiente de variación de Pearson: se calcula como cociente entre la desviación típica y la media de la serie analizada.

Cv = 0,0320 / 1,253

Luego,

Cv = 0,0255

El interés del coeficiente de variación es que al ser un cociente permite comparar el nivel de dispersión de dos muestras, independientemente de los valores que contengan. Esto no ocurre con la desvación típica, ya que viene expresada en las mismas unidas que los datos de la serie.

Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las desviaciones típicas (una viene vienes expresada en cm y la otra en kg). En cambio, sus coeficientes de variación son ambos proporciones (tantos por uno), por lo que sí se pueden comparar.
Programa informático para calcular la media, mediana, varianza y desviación estándar de una serie.

    En este ejemplo podrá ver como se dimensionan matrices para recibir un número determinado de datos, como se piden estos de forma secuencial, como se coloca la propia tabla de datos por orden de menor a mayor, y finalmente como se calculan los parámetros centrales y de dispersión de forma previa a mostrarlos en la pantalla del ordenador. Es una ampliación del desarrollado en el apartado anterior.

    Si dispone del entorno de desarrollo Visual Basic, puede realizar esta misma aplicación apoyada sobre un único formulario, para su utilización en entornos Windows.
 

'Programa para calcular la media, y la mediana de una serie, asi como
'   la varianza y desviación estandar de la misma.

'Borra la pantalla y muestra el título centrado.
CLS
titulo$ = "Cálculo de la media, mediana varianza y SD de una serie de datos"
LOCATE 2, 1
PRINT SPACE$((80 - LEN(titulo$)) / 2); titulo$

'Solocita en número de elementos de la serie.
LOCATE 5, 13
INPUT "Indique el número máximo de elementos de la serie : ", nmax
DIM d(nmax + 1)

'Solicita los datos de la serie de forma secuencial.
FOR i = 1 TO nmax
    LOCATE 7, 30
    PRINT SPACE$(40)
    LOCATE 7, 30
    PRINT "Dato nº "; i;
    INPUT " = ", d(i)
NEXT

'Ordena la serie de menor a mayor.
FOR i = 1 TO nmax - 1
    FOR j = i + 1 TO nmax
        IF d(i) > d(j) THEN
           m = d(i)
           d(i) = d(j)
           d(j) = m
        END IF
    NEXT
NEXT

'Muestra la serie ordenada. Anular una vez comprobado que funciona.
PRINT
PRINT "Serie ordenada : ";
FOR i = 1 TO nmax
    PRINT d(i); " ";
NEXT
PRINT

'Obtiene las sumas de datos y de los cuadrados de los datos,
'   necesarios para los cálculos posteriores.
sum = 0
sum2 = 0

FOR i = 1 TO nmax
    sum = sum + d(i)
    sum2 = sum2 + d(i) ^ 2

NEXT

'Calcula la media aritmética.
media = sum / nmax

'Calcula la mediana como valor central de la serie ordenada  si
'   la serie posee un número impar de datos, y como la media de
'   los 2 centrales si es par.
m = (nmax + 1) / 2
IF m = INT(m) THEN
   mediana = d(m)
ELSE
   m = INT(m)
   mediana = (d(m) + d(m + 1)) / 2
END IF

'Calcula los valores de dispersión de la serie.
varianza = (sum2 - sum ^ 2 / nmax) / nmax
sd = SQR(varianza)

'Muestra los resultados finales en la pantalla, en posiciones preestablecidas.
LOCATE 12, 20
PRINT "Media aritmética .. = "; media
LOCATE 14, 20
PRINT "Mediana ... (p 50%) = "; mediana
LOCATE 16, 20
PRINT "Varianza .......... = "; varianza
LOCATE 18, 20
PRINT "Desviación estandar = "; sd

 

    En negro intenso se han destacado la nuevas líneas de programación que diferencian este pequeño programa del anterior en el que tan solo se calculaban las medidas centrales de la distribución.


Temario.

Buscadores.
 
    Enlace hacia algunos de los "Robots genéricos de búsqueda" mas usados en Internet, desde los que podrá realizar búsquedas selectivas de temas relacionados con la "estadística" en general y la "Bioestadística" en particular:


Ultima modificación: 15-V-2003.