Población y muestra (Inferencia estadística)


El interés de todo investigador es siempre estudia a la población y nunca a la muestra lo que sucede en que la mayoría de las ocasiones la población es inaccesible o inalcanzable por esta razón elegimos un conjunto de sus unidades para conformar la muestra, a este procedimiento de obtener una parte de la población con la finalidad de construir la muestra, se denomina muestreo,  esperamos que las conclusiones que se obtengan a partir de la muestra se han extrapolables hacia la población porque este es el interés del investigador, a este procedimiento de trasladar las conclusiones de la muestra hacia la población se denomina inferencia.
1. La población

La población es el conjunto de todas las unidades de estudio, sujetos u objetos, cuya característica observable o reaccionar que pueden expresar nos interesa estudiar a la población deben situarse claramente entorno  a sus características de contenido, lugar y tiempo a lo cual se le denomina marco muestral, indispensable en los estudios exploratorios y descriptivos, mientras que en los estudios analíticos clásicamente cuantitativos, se precisa delimitar el ámbito de recolección de datos, porque se sobrentiende que sus conclusiones son extrapolables hacia toda la población, representan cualitativamente a toda la población.
La medición completa de todos los elementos que constituyen a la población se llama censo y este no puede ser ejecutado mediante muestreo, no hay que olvidar que nuestro interés radica en estudiar a la población y no a la muestra.
2. La muestra

La muestra es una  estrategia metodológica y estadística que utilizamos cuando luego de realizar un análisis de factibilidad encontramos que no podemos acceder a la población y existe tres casos:
1. La población es desconocida o se carece de  marco muestral lo que no permite definir su magnitud no existe un listado de todos los elementos que conforman a la población, por ejemplo el conjunto de mujeres trabajadoras sexuales, no existe un lista donde estén anotadas todas estas mujeres.
2. La población es inaccesible al investigador, así tenemos que una persona tiene 5 litros de sangre pero bastaran 5 cc para conocer el valor de la hemoglobina, los 5 litros de sangre es la población y los 5cc la muestra, si estudiáramos a los 5 litros agotaríamos la población y esto es incompatible con la vida, luego los 5 cc son descartados y con ello reafirmamos que le interés del investigador no es la muestra sino la población.
3. La población es inalcanzable por su magnitud como en los estudios de prevalencia donde apuntamos a estudiar a todos los elementos de la población, si queremos conocer la prevalencia de una enfermedad en una ciudad conformada por un millón de habitantes esto es un número bastante inalcanzable por esta razón tendremos que elegir un subconjunto denominado muestra.
Una muestra es representativa de la población únicamente si cumple dos condiciones: el tamaño calculado por un algoritmo y la técnica de muestreo que  es un método de selección de las unidades muestrales.
3. Cálculo del tamaño muestral

El tamaño de la muestra se calcula el función al objetivo estadístico y a la naturaleza de la variable aleatoria, existen métodos aleatorios simples estratificados, sistemáticos y por conglomerados,
4. Técnicas de muestreo

Pero también podemos elegir a las unidades muestrales mediante técnicas no probabilísticas como el muestreo por conveniencia el que tenemos a la mano, el de  juicio el que nos sugieren los expertos, por cuotas, el accidental o del voluntariado y el muestreo en bola de nieve es que se consigue primero entrevistando a una unidad y esta a su vez nos presenta sus colegas hasta llegar al punto de la saturación.

Unidades de muestreo (No es sinónimo de unidad de estudio)

Para que una muestra sea representativas de la población tiene que cumplir con el cálculo del tamaño de la muestra y la técnica de muestreo, este segundo procedimiento implica la elección de los elementos que conforman la población para construir nuestra muestra, pero no se elige a las unidades de estudio sino a las unidades de muestreo, esto quiere decir que unidad de estudio no es sinónimo de unidad de muestreo de hecho, en todo trabajo de investigación hay solamente una unidad de estudio, pero pueden haber varias unidades de muestreo, tantas como etapas tenga nuestro muestreo polietápico.
1. Unidades de muestro propias

En la mayoría de los casos la unidad de estudio es la que se muestrea, y en estos casos la unidad de estudio se convierte en unidad de muestreo, este es el caso más frecuente y también es el más exacto, corresponde al muestreo aleatorio simple, pero no  siempre es factible desde el punto de vista de los costos poner en práctica este tipo de muestreo, si queremos conocer la prevalencia de ansiedad previo al examen de admisión en una academia de preparación preuniversitaria que cuenta con mil alumnos, los alumnos son las unidades de estudio y también son las unidades de muestreo si sometemos a aleatorización a estos elementos para confirmar la muestra. Este es el primer caso.
2. Unidades de muestreo conjuntas
Se trata de un conjunto de unidades de estudio donde las características del grupo representan proporcionalmente a las características de la población, por tanto estos grupos podrian considerarse como “mini-poblaciones” porque tienen toda la variabilidad que se observa en la población en este caos lo que se muestrea son estos conjuntos por ejemplo; En un estudio sobre la satisfacción laboral de los trabajadores del Ministerio de la Salud a nivel de la atención primaria, las unidades de estudio son los trabajadores de la salud pero las unidades de muestreo son los centros y puestos de salud, conjuntos de unidades de estudio que tiene la variabilidad que se expresa en la población esto corresponde al muestreo por conglomerados o clúster.
3. Unidades de muestreo identificadoras
Si la unidad de estudio es un conjunto de individuos y la característica en estudio pertenece al grupo y no individualmente a sus elementos, es preciso ubicar a uno de sus elementos que nos permita identificar la unidad de estudio a fin de que podamos ejecutar el muestreo. Veamos, en un estudio para conocer la relación médico-paciente, se evalúa a cada médico y luego a un conjunto de sus pacientes las unidades de estudio son el binomio médico paciente, pero lo que se somete ala aleatorización son los médicos de nada servirá evaluar a los pacientes si no pudimos evaluar al médico, esto es coincidente con el muestro por cuotas, el médico es al unida de muestreo identificadora
4. Unidades de muestreo contenedoras
Son secciones censales, así los denominan los investigadores de las ciencias sociales o areas geográficas, que contiene a la unidad de estudio propio del muestro bietápico estratificado por conglomerados, las unidades muestrales de primera línea son por ejemplo las viviendas familiares y a través de ellas se logra acceder a las unidades de estudio, veamos un ejemplo, en un estudio de preferencias políticas las unidades de estudio son los votantes, pero se muestrean las viviendas en cuyo interior se ubica a la unidad de estudio, la unidad de muestreo es la vivienda y la unidad de estudio es el votante, esto lo podemos ubicar en el muestreo polietapico.

Técnicas de muestreo (Métodos de aleatorización)

Luego de haber realizado el cálculo del tamaño de la muestra tenemos que elegir a los elementos de la población que conformaran nuestra muestra, este proceso se debe realizar aleatoriamente por esta razón al técnicas de muestreo se les puede denominar como métodos de aleatorización, clásicamente existen dos métodos para seleccionar muestras a partir de poblaciones: el muestreo no aleatorio y el muestreo aleatorio, este ultimo incorpora al azar como recurso en el proceso de selección.
Existen 4 técnicas de muestro aleatorio o probabilístico que pueden utilizar  se  de manera aislada o combinada incluso con las técnicas no probabilísticas
1. Muestreo aleatorio simple

Denominado también muestreo equiprobabilístico, porque cada uno de los elementos tienen la misma probabilidad de conformar la muestra, si tenemos un pablaron constituida por mil elementos y deseamos únicamente 200, entonces la probabilidad de que un elemento conforme la muestra es igual a 200 sobre 1000 esto es igual a 0.2 o 1/5 y esto es igual para cada uno de sus elementos. El muestro aleatorio simple es el más rápido de realizar, es el más exacto y también existe software para realizarlo, lo que necesitamos es tener un marco muestral o listado de todas las unidades muestrales que no siempre tenemos a la mano.
2. Muestreo sistemático

Para determinar una muestra de tamaño “n” tenemos que conseguir una lista de “N” elementos, pero no siempre contamos con el marco muestral con el listado total de las unidades de estudio en este punto el investigador plantea o delimita un marco muestral en función al tiempo, por ejemplo 3 meses y luego determina un intervalo de salto dentro de este periodo, por ejemplo estudiar  al elemento número 4, 6, 16, 24. 30 es decir de 6 en 6, a este número se le conoce como intervalo de salto, en este muestreo no se precisa un marco muestral pero si haya descartar la asociación entre el intervalo de salto con la variable de estudio.
3. Muestreo aleatorio estratificado

La idea es producir grupos heterogéneos entre sí respecto de la variable de estudio, pero homogéneos dentro de cada grupo, así podemos asegurar la representación de cada estrato en la muestra, si queremos conocer las opiniones acerca de los métodos anticonceptivos en los estudiantes de enfermería donde sabemos que por cada 10 estudiantes hay un hombre y 9 mujeres esta misma proporción debe representarse en la muestra, a esto se le denomina afijación proporcional, pero no es la única también se puede distribuir a los elementos en función a su variabilidad y a los costos, para esto se debe conocer la distribución de la variable criterio de estratificación en la población. 
4. Muestreo por conglomerados

Consiste en la identificación de conglomerados o clústers que son grupos de elementos. Que tiene la variabilidad de la población, , es lo opuesto al muestreo estratificado, porque los conglomerados son homogéneos entre sí pero sus elementos son heterogéneos. Los centros de salud se puede considerar conglomerados porque en su interior esta todo el equipo de salud al igual que la población y esto es muy eficiente cuando las unidades están muy dispersas, bastará con que estudiemos algunos conglomerados, para poder ejecutar este muestreo hay que conocer la variabilidad de los elementos que conforman cada conglomerado y estar seguro que esa variabilidad es la misma que se encuentra en la población.