Población y muestra: definición y diferencias

Población y muestra

La población y muestra son términos utilizados en estadística para la realización de un estudio determinado. Empecemos por definir cada uno.

¿Qué es población?

Es el conjunto de todos los individuos u objetos de estudio.

En este conjunto se toman datos referentes de ciertas características de un grupo de individuos u objetos, hay una gran variedad de características como la edad y sexo de estudiantes de una escuela o el número de bombillos defectuosos o no producidos por una fábrica en un día determinado.

A veces resulta nada fácil obtener un total de los individuos u objetos observados, en especial si son demasiados numerosos.

Para la solución de este problema se toma una muestra representativa del conjunto de estudio.

¿Qué es muestra?

La muestra en estadística es una porción o un subconjunto que se extrae de una población, con el fin de conocer las características de dicha población.

La muestra nos permite facilitar y simplificar el estudio que se desea realizar.

Está compuesta por un número más manejable que son seleccionados al azar, este número tiene que ser representativo a la hora de hacer el estudio

ya que hemos definido ambos términos, vamos a ver la diferencia que existe entre población y muestra.

Diferencia entre población y muestra.

Una muestra es un subconjunto obtenido de una población.

Comúnmente se utiliza la muestra de una población en la investigación o estudio a realizar, porque es más fácil de procesar un subconjunto que es más pequeño en lugar de toda la población o conjunto.

¿Qué es la toma de datos en la población y muestra?

Es la toma de un grupo representativo de la población, que no han sido ordenados numéricamente. Para que esta selección de datos sea asertiva se debe considerar un porcentaje numérico.

Por ejemplo, si tenemos una población de 1000 individuos u objetos para un determinado análisis, no deberíamos tomar solo 10 de ellos para el estudio, en este caso lo más recomendable es que sean un 10% o 20% para así obtener un resultado más confiable.

Ejemplo:

Las ventas mensuales de un determinado producto. A continuación, se indican en la siguiente tabla. Observamos que la variable es discreta.

tabla de datos

Tomamos esta pequeña muestra para conocer los valores de la demanda y decidir cuando y en qué momento completar dicho producto. Ordenamos los datos de la muestra para así facilitar nuestro análisis, el orden será de menor a mayor (orden creciente).

Elaboramos una tabla que indique la frecuencia de cada demanda posible.

Tabla de demanda

Frecuencia absoluta

Es la cantidad de veces que se repite un mismo valor. Para obtener la frecuencia absoluta debemos organizar los datos de forma creciente.

Se cuenta la frecuencia absoluta de cada valor.

En el ejemplo podemos ver que el valor menor es 10 y el valor mayor es 44, de estos datos surge el concepto de rango.

¿Qué es el rango?

Es la diferencia que existe entre el valor mayor y el menor de los valores obtenidos.

En este caso nuestro rango sería 44-10 = 34.

Observemos el siguiente histograma de frecuencia.

Histograma de frecuencia

La Frecuencia Relativa:

Es el cociente entre la frecuencia que se presenta cada valor y el total de las observaciones.

Calcular frecuencia relativa
  • Fr = Frecuencia relativa
  • Fi = Frecuencia absoluta correspondiente a cada valor i
  • n = Número de observación total
Valor de n
Histograma de frecuencia absoluta

En el histograma de frecuencias relativas nos proporciona para cada valor de demanda el porcentaje total de observaciones que tomaron ese valor.

Para poder simplificar un poco este proceso podemos recurrir a la agrupación por clases o categorías y determinar el número de valores correspondiente a cada clase, este proceso se conoce como frecuencia de clase.

Frecuencia de clase.

Si analizamos nuestro ejemplo, podemos ver que las 36 frecuencias obtenidas mediante el orden anterior pueden ser muy amplias para visualizar el problema, es por ello que agruparemos los datos por clase, cada clase ocupa un número que por lo general es fijo de valores posibles, para este ejemplo el tamaño de la clase será igual a 10, obteniendo así la siguiente agrupación de datos.

Intervalo de datos

Los valores comprendidos entre (10-9) hasta el (40-49) se conocen como intervalos de clases, siendo cada par de valores los límites de clase.

El número menor de la frecuencia absoluta es el límite inferior y el número mayor de la frecuencia absoluta es el límite superior, la tabla anterior se conoce como distribución de frecuencia.

Finalmente, podemos decir que la población y muestra son de vital importancia para la estadística, ya que facilitan el trabajo de la recolección y estudio de los datos de un determinado conjunto.

Deja un comentario

Tu dirección de correo electrónico no será publicada.

Ir arriba
Share to...