Con el propósito de medir la dispersión o variabilidad, se discutirán en este apartado las medidas de: Amplitud (llamada también rango o recorrido), Desviación media, Varianza, Desviación Estándar (también llamada desviación típica) y Coeficiente de Variación.
Amplitud o recorrido
La medida de dispersión más simple recibe el nombre de Amplitud o recorrido y es muy poco usada puesto que su única ventaja es la sencillez con que se calcula. Es común que se use también el nombre de Rango para esta medida. La amplitud (A) de un conjunto de datos es la diferencia entre las observaciones que tienen el mayor y el menor valor numérico en el mismo.
Por ejemplo: Supóngase que en un hospital el pulso de cada paciente se mide tres veces al día y que cierto día los registros de dos pacientes muestran:
Paciente 1: 73 77 74
Paciente 2: 64 90 73
¿Cuál es la Amplitud en pulsaciones para cada paciente?
Para calcular la amplitud de los datos necesario identificar el valor más grande y el valor más pequeño del conjunto de datos de cada uno de los pacientes.
Para el Paciente 1:
A = 77 - 73 = 4
Para el Paciente 2:
A = 90 - 64 = 26
La amplitud es una medida de dispersión cuya ventaja es la facilidad con que se calcula. Tiene en cambio las siguientes desventajas:
En su cálculo sólo intervienen dos elementos del conjunto.
Al aumentar el número de observaciones, puede esperarse que aumente la variabilidad. Puesto que la amplitud no tiene en cuenta el tamaño del conjunto, no es una medida adecuada para comparar la variabilidad de dos grupos de observaciones, a menos que éstos sean del mismo tamaño.
Desviación media, desviación estándar y varianza
Para presentar la desviación estándar, que es por mucho la medida generalmente más útil de la dispersión, obsérvese que la dispersión de un conjunto de datos es pequeña si los valores se agrupan en forma cerrada en torno a su media y es grande si los valores se dispersan ampliamente en torno a su media. Por tanto, parecería razonable medir la dispersión de un conjunto de datos en términos de las cantidades en las cuales difieren los valores individuales de su media. Si se tiene un conjunto de números:
Como realmente se está interesado en la magnitud de las desviaciones, y no si son positivas o negativas, se pueden ignorar simplemente los signos y definir una medida de variación en términos de los valores absolutos de las desviaciones de la media. En realidad, si se suman las desviaciones de la media como si fueran todas positivas o cero y las dividiéramos entre N, se obtendría la media estadística que se denomina desviación media y se representa por:
Esta medida tiene una apariencia intuitiva, pero debido al valor absoluto, lleva a encontrar dificultades teóricas en problemas de inferencia y rara vez se usa.
Un método alternativo consiste en trabajar con los cuadrados de las desviaciones de la media, ya que también esto eliminará el efecto de los signos. Los cuadrados de números reales no pueden ser negativos y pueden tomar el valor de cero.
Por consiguiente, si se promedia las desviaciones cuadradas de la media y se toma la raíz cuadrada del resultado (para compensar el hecho de que las desviaciones fuesen cuadradas), se obtiene la Desviación estándar de la población.
Su cuadrado s2, se llama la Varianza de la muestra.
Al dividir entre n-1 en vez de hacerlo entre n, tiene una buena razón. Si se dividiera entre n y se utilizara s2 como estimación de
No hay comentarios.:
Publicar un comentario