Definición de Estadística
La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones.
Un estudio estadístico consta de las siguientes fases:
-Recogida de datos.
-Organización y representación de datos.
-Análisis de datos.
-Obtención de conclusiones.
Conceptos de Estadística
Población
Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.
Ejemplo: Conjunto de todos los alumnos de secundaria de la Comunidad de Madrid.
Muestra
Una muestra es un conjunto representativo de la población de referencia, el número de individuos de una muestra es menor que el de la población.
Ejemplo: De entre todos los alumnos de secundaria de la Comunidad de Madrid escogemos los de Humanes.
Individuo
Un individuo o unidad estadística es cada uno de los elementos que componen la población.
Ejemplo: Cada uno de los alumnos de secundaria de la Comunidad de Madrid.
Variable estadística
Definición de variable
Una variable estadística es cada una de las características o cualidades que podemos estudiar en los individuos de una población.
Tipos de variable estadísticas
Variable cualitativa
Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos:
Variable cualitativa nominal
Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden. Por ejemplo:
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
Variable cualitativa ordinal o variable cuasicuantitativa
Una variable cualitativa ordinal presenta modalidades no númericas, en las que existe un orden. Por ejemplo:
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...
Medallas de una prueba deportiva: oro, plata, bronce.
Variable cuantitativa
Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:
Variable discreta
Una variable discreta es aquella que toma valores aislados, es
decir no admite valores intermedios entre dos valores específicos. Por
ejemplo:
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Variable continua
Una variable continua es aquella que, al menos teóricamente, puede admitir infinitos valores entre dos números dados. Por ejemplo:
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales, cuatro, etc.
Recuento y gráficos
Es parte del proceso, después de recopilar los datos se procede a su recuento para expresarlos de forma ordenada y para que sea más fácil trabajar con ellos.
Generalmente se elabora una tabla como se muestra a la izquierda donde puedes practicar.
• Frecuencia absoluta, es el nº de veces que aparece un dato. A la de xi la llamaremos fi.
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor y en la segunda anotamos la frecuencia absoluta.
xi | fi |
---|---|
27 | 1 |
28 | 2 |
29 | 6 |
30 | 7 |
31 | 8 |
32 | 3 |
33 | 3 |
34 | 1 |
31 |
• Frecuencia relativa, es el cociente entre la frecuencia absoluta y el nº total de datos.
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
xi | fi | ni |
---|---|---|
27 | 1 | 0.032 |
28 | 2 | 0.065 |
29 | 6 | 0.194 |
30 | 7 | 0.226 |
31 | 8 | 0.258 |
32 | 3 | 0.097 |
33 | 3 | 0.097 |
34 | 1 | 0.032 |
31 | 1 |
• Frecuencia acumulada de un dato, es la suma de las frecuencias absolutas de los valores que
son menores o iguales que él, la indicaremos con Fi. También se pueden calcular las
frecuencias relativas acumuladas.
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
xi | fi | Fi |
---|---|---|
27 | 1 | 1 |
28 | 2 | 3 |
29 | 6 | 9 |
30 | 7 | 16 |
31 | 8 | 24 |
32 | 3 | 27 |
33 | 3 | 30 |
34 | 1 | 31 |
31 |
Diagramas de barras y de sectores
Los datos estadísticos suelen representarse de forma gráfica, ya que de esta forma podemos hacernos una
idea de su distribución de un solo golpe de vista. En función del tipo de variable conviene más usar un tipo de gráfico u otro.
• Diagrama de sectores, puede aplicarse a cualquier tipo de variable, aunque es el más
adecuado en variables cualitativas y para una primera toma de contacto con los valores de
una población. Es un círculo dividido en sectores de ángulo proporcional a la frecuencia de cada valor.
La amplitud de cada sector se obtiene multiplicando la frecuencia relativa por 360º.
• Diagrama de barras. También puede aplicarse a cualquier tipo de variable, aunque
se considera el idóneo para variables discretas. Cada valor se corresponde con una barra de longitud proporcional a su frecuencia.
Agrupación de datos en intervalos
En variables continuas, o en discretas cuanto el número de datos distintos se hace casi tan grande
como el número de datos, y para poder estudiarlos, se hace necesario agruparlos en intervalos o clases,
habitualmente de la misma amplitud y como mínimo cuatro.
Por ejemplo, en una población hay casi tantas alturas como individuos pero podemos agruparlos en bajos,
medios y altos; también podríamos hacer bajos, medios-bajos, medios-altos y altos, o clasificarlos de
10 en 10 cm, o de 20 en 20...
• Para representar a todos los datos de un intervalo elegimos un valor, el punto medio del
intervalo, se llama marca de clase.
Histograma
Cuando los datos vienen agrupados en intervalos se usa para representarlos gráficamente el histograma. Cada valor se representa con un rectángulo de anchura el intervalo correspondiente y con la altura
proporcional a su frecuencia.
Polígono de frecuencias.
Lo creamos al unir los extremos superiores de las
barras de los histogramas o de los diagramas de barras.
Medidas de dispersión.
Rango y Desviación media
Las medidas de dispersión indican si los datos están más o menos agrupados respecto de las medidas de
centralización.
• Rango o recorrido, es la diferencia entre el mayor y el menor valor de la variable, indica la longitud del intervalo en el que se hallan todos los datos. Aunque el rango da una información importante,
resulta más interesante calcular cuánto se desvían en promedio los datos de la media.
• Desviación media, es la media de los valores absolutos de las diferencias entre la media y los diferentes datos.
No hay comentarios.:
Publicar un comentario