Google
 

Principal - Indice

 
   

EL MUESTREO

 

1. La operacionalización

            Junto con la definición y especificación del diseño a desarrollar en la investigación, la operacionalización constituye el problema de mayor importancia a resolver en la fase que hemos denominado metodológica (ver LA INVESTIGACIÓN CIENTÍFICA 1.). Esta tarea consiste en hacer operativos, es decir manejables, posibles de trabajar con ellos, a los conceptos y elementos que intervienen en el. problema a investigar. Constituye por lo tanto el eslabón indispensable que permite verificar en la práctica las proposiciones del marco teórico elaborado, la actividad que posibilita acercarse a la realidad para adquirir la información necesaria que concretamente nos habrá de resultar de utilidad.

 

            La importancia de una correcta operacionalización se expresa por sí misma: si nuestras variables no pueden ser medidas y evaluadas en la realidad, o si lo que medimos y evaluamos no se corresponde con nuestras formulaciones iniciales, todas nuestras conclusiones estarán vacías de contenido empírico o, a lo sumo, expresarán una realidad divergente de la que nos interesa conocer. En otras palabras, la investigación perderá todo sentido, y derivará en un mero ejercicio de especulación o en una serie de confusiones, imprecisiones y errores, que le restarán carácter científico. De aquí que el investigador deba atender cuidadosamente a la correcta realización de esta etapa, para evitar desperdiciar todo el esfuerzo hecho hasta el momento.

            La estrecha relación que existe entre operacionalización y tipo de diseño se origina en que, de acuerdo al tipo de método general a utilizar (diseño) se requerirá con mayor preponderancia uno u otro tipo de datos, operacionalizar de una cierta manera o de otra. Inversamente, de acuerdo a las posibilidades concretas de operacionalizar en uno u otro sentido las variables y el universo considerados, es que será más o menos adecuado un cierto tipo de diseño. Por esta razón, ambas tareas deben encararse casi simultáneamente, atendiendo a las repercusiones que las decisiones en un aspecto pueden acarrear en el otro. La separación que hacemos en este texto es, por lo tanto, algo artificial, y responde más a propósitos de ordenamiento del material que a la dinámica real del proceso de investigación.

            En cuanto a los elementos que es necesario operacionalizar pueden dividirse en dos grandes campos, que requieren un tratamiento diferenciado por su propia naturaleza: el universo, las variables. La operacionalización del universo consiste en reducir a proporciones factibles de investigar al conjunto de las unidades que nos interesan, en otras palabras, en la tarea de encontrar una forma de obtener información relevante sin necesidad de acudir a la medición de todo el universo posible de datos. Es el aspecto cuantitativo de la operacionalización y, para resolverlo, habrá de apelarse entre otras disciplinas a la estadística, mediante las técnicas de muestreo. La operacionalización de las variables es, por el contrario, de naturaleza básicamente cualitativa, y tiene por objeto encontrar en la práctica los indicadores a través de los cuales se expresan concretamente las variables. En este capítulo nos ocuparemos del problema de obtención de muestras, dejando para el subsiguiente lo relativo a la búsqueda de indicadores para las variables. Antes, sin embargo, será necesario clarificar algunos conceptos como los de unidad, dato, etc. , que encararemos seguidamente.

2. Datos y unidades

            Por dato entendemos cada uno de los elementos de información que ha de ser recogido durante el desarrollo de la investigación, y en base a los cuales, en su conjunto, podrán extraerse conclusiones de relevancia en relación al marco teórico elaborado.

            Cualquier información, por más pequeña y fragmentaria que sea, puede considerarse como un dato, siempre y cuando sea capaz de esclarecer, de algún modo, los problemas que nos planteamos en un estudio. Saber, por ejemplo, que la persona N.N. opina que las pruebas nucleares deben ser proscriptas es un dato. Esa información, por sí sola, carece prácticamente de valor, pues poco podemos conocer respecto de las reacciones que despiertan las pruebas de armas atómicas con ese único dato. Pero el valor del dato reside no en su alcance individual, en lo que nos dice en sí mismo, sino en su posibilidad de ser integrado en conjuntos mayores. Es sólo ahí, cuando. agrupamos muchos datos, cuando, en nuestro ejemplo, consultamos a muchas personas respecto a la opinión que tienen sobre el tema, que cada dato individual se hace valioso dentro de una perspectiva más general. Así podemos llegar a enunciar que un determinado tanto por ciento de las personas están en contra de esos ensayos nucleares, y comparando esta posición con otras sobre temas similares llegar a un conocimiento generalizado sobre algún campo del saber .

            En el caso anterior cada dato provenía directamente de alguna pregunta que se formulaba a personas determinadas. En ese sentido puede decirse que cada una de estas personas se constituye en el origen, en la fuente de los datos obtenidos. Estas fuentes, que pueden ser personas, observaciones directas de situaciones, libros, documentos, etc., Son las que llamamos unidades de datos, y a su conjunto, a la suma de todas las unidades, se le da el nombre de universo.

            En general toda investigación puede considerarse como una búsqueda de los datos apropiados que permitan resolver ciertos problemas de conocimiento, obtenidos a través de un conjunto de unidades que constituyen el universo dentro del que opera la investigación.

            Es de primordial importancia en todo trabajo, entonces, definir con claridad el tipo y las características concretas de los datos requeridos. Para conocer el comportamiento de una variable es preciso conocer los datos específicos que nos ilustren acerca del mismo; para eso se deberá encontrar cuáles son los datos capaces de hacerlo, operacionalizando las variables en estudio mediante el hallazgo de indicadores apropiados.

            En cuanto a las unidades que intervienen en la investigación, puede ocurrir con ellas que su número sea excesivo, lo que no permite un examen sistemático de todas ellas. Para resolver este inconveniente se acude a la operacionalización del universo mediante la extracción de muestras, tal como veremos a continuación, así como a otras técnicas selectivas que no desarrollaremos.

3. Universo y muestra

            En el caso de que nuestro universo esté compuesto por un número relativamente alto de unidades será prácticamente imposible, por razones de tiempo y de costos, y porque no es en realidad imprescindible, examinar cada una de las unidades que lo componen. En vez de realizar esa fatigosa tarea procederemos a extraer una muestra de ese universo, o sea un conjunto de unidades, una porción del total, que nos represente la conducta del universo total. Una muestra, en un sentido amplio, no es más que eso, una parte respecto al todo constituido por el conjunto llamado universo.

            Sin embargo, no todas las muestras resultan útiles para llevar a cabo un trabajo de investigación. Lo que se busca al emplear una muestra es, evidentemente, lograr que, observando una porción relativamente reducida de unidades, podamos obtener conclusiones semejantes a las que lograríamos si estudiáramos el universo total. Cuando una muestra cumple con esta condición, es decir, cuando nos refleja en sus unidades lo que ocurre en el universo, la llamamos muestra representativa. Sus conclusiones son susceptibles de ser generalizadas al conjunto del universo, aunque para ello debamos añadir un cierto margen de error en nuestras proyecciones. Casi todas las muestras que se utilizan en las investigaciones son muestras representativas no obstante que, en algunos casos, se empleen muestras no representativas. Ello ocurre cuando no se pretende hacer un trabajo muy riguroso, cuando se busca conocer apenas algunos indicios generales de un problema, o cuando el tiempo impide otra forma de trabajo más estricta. De ninguna manera es lícito, sin embargo, proyectar estos conocimientos de tipo sumario hacia el universo, puesto que sólo deben tomarse como simples aproximaciones previas para estudios más sistemáticos.

            No puede saberse nunca a priori si una muestra que se ha sacado es o no representativa, pues para saberlo con absoluta certeza sería necesario investigar todo el universo y luego comparar ambos resultados. Como esto resulta tan absurdo como encender todos los fósforos de una caja para saber si son buenos, lo que se hace es acudir a procedimientos matemáticos que son capaces de decimos con qué nivel de confianza trabajamos ante una muestra determinada. El estudio de estos procedimientos corresponde al campo de la estadística. No es el objeto de nuestro trabajo desarrollar temas que por su complejidad han sido tratados extensamente en trabajos especializados. Simplemente nos remitiremos a dar una idea general de los principales tipos de muestras que se utilizan, y de las técnicas que permiten obtenerlas.

            Una primera división que suele hacerse entre las muestras consisten separarlas en muestras probabilísticas y no probabilísticas. En las del primer tipo la característica fundamental es que todo elemento tiene una determinada probabilidad de integrar la muestra, y esa probabilidad puede ser calculada matemáticamente con precisión. En las muestras no probabilísticas no ocurre lo mismo, y el investigador procede en cierta forma a ciegas, pues no puede tener idea del error que puede estar introduciendo en sus apreciaciones.

            Las muestras no probabilísticas más utilizadas son las llamadas accidentales, por cuotas e intencionadas.

            Una muestra accidental es aquélla que se obtiene sin ningún plan preconcebido, resultando las unidades escogidas producto de circunstancias fortuitas. Si, por ejemplo, entrevistamos a los primeros cincuenta transeúntes que pasan por una cierta calle, estaremos en presencia de una muestra accidental; esas personas podrán representar no al conjunto de la población, ya que de acuerdo a la hora, el lugar elegido u otras circunstancias, serán un reflejo más o menos fiel del universo. El investigador no puede saberlo, por lo que sus resultados no podrán proyectarse, con confiabilidad a ese universo.

            Una muestra por cuotas consiste en predeterminar la cantidad de elementos de cada categoría que habrán de integrarla. Así podemos asignar una cuota de 50 hombres y 50 mujeres a una muestra de 100 individuos, asumiendo que esa es la distribución de la población total. Por más que esa presunción llegue a ser válida no deja de existir cierta arbitrariedad en esa determinación, por lo que la rigurosidad estadística de las muestras por cuotas se reduce considerablemente.

            Una muestra intencionada escoge sus unidades no en forma fortuita sino completamente arbitraria, designando a cada unidad según características que para el investigador resulten de relevancia. Estas muestras son muy útiles y se emplean frecuentemente en los estudios dc caso, por más que la posibilidad de generalizar conclusiones, a partir de ellas, sea en rigor nula. (EL DISEÑO DE INVESTIGACIÓN 4.5.).

4. Muestras aleatorias

            En las muestras aleatorias cada uno de los elementos del universo tiene una probabilidad determinada y conocida de ser seleccionado para aparecer en ella. Para que esto suceda así es necesario proceder mediante ciertas técnicas a la extracción de la muestra, que nos garanticen probabilidades determinadas para cada elemento. Los procedimientos para la obtención de muestras aleatorias son los siguientes:

4.1. Al azar simple

            Este procedimiento consiste en elaborar una lista con todas las unidades que configuran el universo, numerando correlativamente a cada una de ellas. Luego, mediante cualquier sistema de azarificación (tabla de números al azar, bolilleros, etc.) se van sorteando estos números hasta completar el total de unidades que deseamos que entren en la muestra. De este modo, la probabilidad que cada elemento tiene de aparecer en la muestra es exactamente la misma.

            Este método nos garantiza una selección completamente aleatoria pero resulta muy lento y costoso pues nos obliga a confeccionar listas completas de todas las unidades. Además se requiere realizar una por una la selección de todas ellas, lo que puede llegar a ser fatigoso. Por este motivo sólo se emplea el sistema del azar simple cuando los universos son relativamente pequeños, cuando, por diversas causas, es posible conocer taxativamente cada una de las unidades, y cuando además la muestra no tiene dimensiones muy amplias. Este método no será adecuado si, por ejemplo, queremos sacar una muestra de todas las personas analfabetas que existen en un país, pues por su número y por lo indeterminado de su situación nos será imposible confeccionar la lista de todas las que existen. En cambio si nuestra intención es la de extraer una muestra del universo de todos los alumnos que ingresan a una universidad en un determinado año, podrá considerarse un método adecuado, puesto que se trata de una cantidad menor de unidades, que además están registradas ya en listas pertinentes.

4.2. Al azar sistemático

            Su idea básica es similar ala de la técnica anterior, partiéndose también, en este caso, de un listado completo de las unidades que integran al universo. Luego, en vez de proceder a escoger una por una las unidades por los método ya señalados se efectúan las siguientes operaciones: 

a) se calcula la constante K, que resulta de dividir el número total de unidades que habrán de integrar la muestra: 

Donde:

N = número total dc unidades que componen el universo. 

n = número total de unidades que integrarán la muestra.

b) Una vez calculado el valor de K se efectúa un sorteo para elegir un número que sea inferior o igual a su valor. Como primera unidad a integrar la muestra se elige aquella que en la lista general posea idéntico número de orden al sorteado. Si designamos con A a este primer valor, la segunda unidad escogida será la que lleve el número A + K, la tercera corresponderá a A + 2K, y así sucesivamente.

            Supongamos un universo constituido por 2.800 elementos; del que deseamos obtener una muestra de 70 casos. Tenemos entonces:

             

 

            Ahora, mediante cualquier procedimiento, buscamos al azar un número entero cuyo valor figure entre los límites de 1 y 40. Sea el número escogido, en este caso, el 32. Entonces, las unidades que pasarán a formar parte de la muestra serán las que lleven los siguientes números de orden:

4.3. Muestras por conglomerados

            Esta técnica tiene utilidad cuando el universo que se requiere estudiar admite ser subdividido en universos menores -en partes del mismo- de características similares a las del universo total. Cuando es posible asumir esta alternativa se procede a subdividir el universo en un número finito de conglomerados. Entre ellos se pasa a. escoger algunos que serán los únicos que se procederá a investigar. Esta elección puede realizarse ya sea por el método del azar simple o del azar sistemático. Una vez cumplida esta etapa puede efectuarse una segunda selección, dentro de cada uno de los conglomerados elegidos, para llegar a un número aún más reducido de unidades muestrales.

            La ventaja de esta técnica es que obvia la tarea de confeccionar el listado con todas las unidades del universo, lo cual, como ya veíamos, es imposible de hacerse en muchos casos. Su des- ventaja mayor radica en que al efectuarse el muestreo en dos etapas los errores muestrales de cada una se van acumulando, dando un error mayor que para los métodos descritos anteriormente.

            Suele utilizarse cuando queremos ex traer muestras de los habitantes de un conjunto geográfico amplio, (ver gráfico), una gran ciudad o un conjunto de aldeas, por lo que se procede a tomar cada aldea o grupo de manzanas como un conglomerado independiente.

4.4. Muestras estratificadas

            A la inversa de lo que sucedía en el caso anterior, este método supone que el universo pueda desagregarse en sub-conjuntos menores, homogéneos internamente, pero heterogéneos entre sí. Es como si fragmentáramos el universo en estratos o categorías de unidades, diferenciándolos de acuerdo a alguna variable que resulte de interés para la investigación. Cada uno de estos estratos se toma luego como un universo particular, ya de tamaño más reducido, y sobre él se seleccionan muestras según cualquiera de los procedimientos ya indicados. Este sistema resulta muy práctico y confiable aunque también aquí el error total se incrementa respecto a los métodos de azar simple o sistemático.

            Por ejemplo, si quisiéramos estudiar las actitudes políticas de los estudiantes de una universidad, podríamos subdividirlos en estratos de acuerdo al tipo de estudios que cursen, asumiendo que estas actitudes van a ser diferentes entre quienes siguen Ingeniería, Letras, Medicina, etc.

            Existen otras posibilidades de extracción de muestras, además de las que surgen de la combinación de los tipos ya enunciados, así como diversos problemas técnicos que se plantean en su aplicación y desarrollo. Preferimos, sobre este tema, remitir al lector a los tratados especializados que versan sobre tales problemas, por cuanto su explanación excedería tos límites de nuestro trabajo.

5. Tamaño de la muestra y error muestral

            Cuando una muestra es aleatoria o probabilística es posible calcular sobre ella el error muestra!. Este error indica el porcentaje de incertidumbre, o riesgo que se corre de que la muestra escogida no sea representativa. Es decir, si trabajamos con un error calculado en 5 por ciento, significa que existe 95 por ciento de probabilidades de que el conjunto muestral represente adecuadamente al universo del cual ha sido extraído.

            A medida que incrementamos el tamaño de la muestra el error tiende a reducirse, pues la muestra va acercándose más al tamaño del universo. Del mismo modo, para una muestra determinada, su error será menor cuanto más pequeño sea el universo a partir del cual se la ha seleccionado. Así, para un universo de 10.000 casos, una muestra de 200 unidades tendrá un error mayor que una de 300; una muestra de 200 casos, por otra parte, tendrá un error mayor si el universo de referencia tiene 10.000 unidades que si éste posee solamente 2.000. Debemos advertir que el error muestral nunca puede concebirse como un porcentaje del tamaño de la muestra respecto al del universo. La variación de los errores al variar estas cantidades se da proporcionalmente pero no de acuerdo a ecuaciones lineales. Por ello es preciso calcular en cada caso el error que podemos cometer, el porcentaje de riesgo, de acuerdo a los datos concretos disponibles.

            Para fijar el tamaño de la muestra adecuado a cada investigación es preciso primero determinar el porcentaje de error que estamos dispuestos a asumir. Una vez hecho esto deberán realizarse las operaciones estadísticas correspondientes para poder calcular el tamaño de la muestra que nos permite situarnos dentro del margen de error aceptado. Es decir que no se fija primero el número de unidades de la muestra para luego proceder a determinar el riesgo que se corre, sino a la inversa, se pone un límite a este riesgo y en función de eso se define el tamaño de la muestra que nos garantiza no sobrepasarlo.

            A veces, sin embargo, el tamaño de la muestra queda fijado previamente por consideraciones prácticas; en tales casos no hay otra alternativa que aceptar el nivel de error que su magnitud acarree.

 

 
 

 

Educar - Argentina

webmaster: Marcelo Adrián Fuentes