Estadistica-Introducción
1.- Elementos
a) Población: engloba a todo el conjunto de elementos que posee la información que queremos estudiar.
Por ejemplo: si vamos a analizar la estatura media de los españoles la población serían todos los ciudadanos españoles.
b) Individuo: cada elemento de la población. En este ejemplo cada español es un individuo.
c) Muestra: del total de la población se selecciona un grupo representativo del que vamos a extraer información.
Por ejemplo: para analizar la estatura media de los españoles no podemos recoger esta información de los 44 millones de ciudadanos españoles sino que definimos un grupo de estudio, por ejemplo seleccionamos a 2.000 personas.
Este grupo tiene que ser representativo de la sociedad española por lo que tiene que incluir a hombres y a mujeres, a gente de la ciudad y del campo, a gente de diversos niveles de renta, de diversas edades. Es decir, la muestra tiene que ser como una imagen “en miniatura” de la población.
Por ejemplo, no podemos seleccionar estas 2.000 personas exclusivamente del entorno urbano y de niveles elevados de renta ya que probablemente su estatura sea superior a la de la media de los españoles, y por lo tanto las conclusiones que obtengamos no sean aplicables a la población española en su conjunto.
Para seleccionar la muestra, hay diversos métodos:
Muestreo aleatorio simple: se seleccionan los individuos de la muestra al azar. En nuestro ejemplo el tamaño de la muestra es de 2.000 observaciones.
Muestreo estratificado: se divide la población en grupos con características diferenciadas y luego se seleccionan individuos al azar dentro de cada grupo. De esta manera se busca que la muestra tenga una estructura similar a la de la población
Por ejemplo, dentro de la población española distinguimos diversos grupos en función del sexo, de la edad, del nivel de renta, del entorno rural y urbano… De cada uno de estos grupos seleccionamos al azar los individuos que van a constituir la muestra. El número de individuos que seleccionaremos de cada grupo estará en función del peso que dicho grupo tenga en el total de la población española.
Por ejemplo: si las mujeres con edad entre 30 y 40 años y con nivel económico medio constituyen el 16% de la población española, de este grupo tendremos que seleccionar el 16% de los individuos de la muestra que vamos a analizar.
La validez de las conclusiones del análisis estadístico va a depender en gran medida de que el tamaño de la muestra sea adecuado. Por ejemplo, no se pueden extraer conclusiones de la estatura media de los españoles en base a un estudio con 5 personas; probablemente tampoco sea necesario analizar 100.000 ciudadanos (hay técnicas estadísticas que determinan el tamaño apropiado que debe tener una muestra en función de determinadas características de la población y del tipo de variable a analizar, así como del error que se quiera asumir).
d) Variable estadística: cada característica de la muestra que vamos a analizar y de la que recabamos información constituye una variable estadística.
Por ejemplo, si estudiamos la estatura media de un país, la estatura media es la variable estadística.
En un mismo estudio se pueden analizar conjuntamente varias variable estadísticas: por ejemplo, podríamos analizar la estatura (1ª variable), distinguiendo por sexo (2ª variable) y por edades (3ª variable).
La variable estadística puede ser:
Cualitativa: aquella característica que no se puede representar numéricamente. Por ejemplo, el sexo (hombre / mujer).
Cuantitativa: aquella característica que sí se puede representar numéricamente. Por ejemplo, la altura (1,75 cm, 1,82 cm…) y la edad (14 años, 21 años…).
Las variables numéricas pueden tomar a veces valores muy concretos (por ejemplo, número de años de un alumno en el colegio: de 1 a 15), en cuyo caso se denominan variables cuantitativas discretas; y otras veces pueden tomar un número casi ilimitado de valores (por ejemplo, precio de la vivienda: 150.800 euros, 163.540 euros, 171.902 euros….), en cuyo caso se denominan variables cuantitativas continuas.
e) Dato estadístico es cada una de los valores que toma la variable estadística analizada:
Joaquín P.: hombre, 47 años, 1,77 m
María C.: mujer, 33 años, 1,68 m
Se denomina modalidad a los diferentes valores que puede tomar una variable.
Sexo: puede ser masculino o femenino
Edad: 18 años, 19 años, 20 años hasta, 80, 90…
2.- Tabla estadística
Los datos obtenidos en la observación hay que ordenarlos y recogerlos en una tabla que se denomina tabla estadística.
En una tabla estadística se recoge la siguiente información:
Frecuencia absoluta de un dato es el número de veces que aparece ese dato en las observaciones.
Frecuencia relativa es el porcentaje que representa la frecuencia absoluta respecto del total.
Veamos un ejemplo:
Vamos a analizar la estatura media de los habitantes de una ciudad. Hemos seleccionado una muestra con 100 observaciones. La información que recogemos de cada habitante es:
La siguiente tabla recoge la totalidad de las mediciones de altura:
La información obtenida la ordenamos y representamos en una tabla estadística.
Como hay mucha dispersión en los datos obtenidos la información resulta difícil de interpretar. Por eso vamos a agruparla en intervalos de clase:
3.- Gráficas
Las frecuencias absolutas o relativas se pueden representar de diversas formas: por ejemplo, sobre una gráfica de barras. Cada barra representa un valor de la variable. La altura de cada barra representa el valor de la frecuencia.
En este gráfico hemos representado la frecuencia absoluta.
También se puede utilizar el diagrama de sectores para representar las frecuencias (absolutas o relativas). Se utiliza un círculo dividido en sectores; cada sector representa un valor de la variable; la superficie del sector mide la frecuencia (absoluta o relativa).
Y también se puede representar la información con un gráfico de líneas.