Preview only show first 10 pages with watermark. For full document please download

Tercera Unidad Estaditica

Descripción: tererminción estadístico de investigación de mercado

   EMBED


Share

Transcript

UNIVERSIDAD NACIONAL DE TUMBES ESCUELA DE POST GRADO CURSO ESTADÌSTICA TERCERA UNIDAD:- MUESTREO ESTADÌSTICO Y TAMAÑO DE MUESTRA MUESTREO El Muestreo es un área de la Estadística, de suma importancia. Nos permite calcular una Muestra representativa y adecuada de la población de la cual procede, para realizar una INFERENCIA VÀLIDA respecto al PARÁMER! en estudio. Es sumamente importante mencionar las di"erentes alternativas #ue e$isten para realizar realizar una investi%aci investi%ación, ón, en cada uno de las cuales, el ob&etivo ob&etivo "inal es calcular el tama'o de la Muestra para realizar in"erencias con"iables. con"iables. (a investi%ación puede ser ori%inal o puede basarse en antecedentes. ¿Cuándo ! "n#$%&"'!(")n %$ *!%! $n !n&$($d$n&$%+ (o,o %$ (!(u! $ &!,!o &!,!o d$ ! Mu$%&. Mu$%&.!/!/- )e primera intención el investi%ador * #ue es una persona idónea en el campo en el cual +a planteado ob&etivos a lo%rar, por  tanto +ipótesis a e valuar valuar * debe cali"icar al antecedente antecedente o antecedentes antecedentes #ue e$is e$iste ten n y de"i de"ini nirr #ue #ue real realme ment nte e cump cumple len n con con el ob&e ob&etitivo vo de cons constititu tuir  ir  antecedentes del estudio.  A partir de este +ec+o, +ec+o, los di"erentes indicadores #ue se necesitan para el cálc cálcul ulo o del del tama tama'o 'o de mues muestra tra medi median ante te el Marc Marco o eóric órico o Esta Estadí díst stic ico o Matemático Matemático se obtiene obtiene del antecedente antecedente o antecedentes antecedentes las re"erencias re"erencias más importantes. ¿Cuándo ! "n#$%&"'!(")n $% o."'"n!+ (),o %$ (!(u! $ &!,!o d$ ! Mu$%&.!/ e +ace +ace uso uso de una una mues muestr tra a pilo piloto to o encu encues esta ta pilo piloto to.. (os (os di"e di"ere rent ntes es indicadores #ue se necesitan para calcular el tama'o de muestra se obtienen de los resultados obtenidos en la evaluación realizada en la Muestra Piloto. on on dos dos alte altern rnat ativ ivas as suma sumame ment nte e impo import rtan ante tess de traba traba&o &o,, las las cual cuales es al cump cumplir lirla lass estr estr-c -cta tame ment nte e esta estamo moss en cond condic icio ione ness de obte obtene nerr el tama tama'o 'o muestral esperado para lo%rar in"erencias con"iables. Mu$%&. Mu$%&.! ! P"o&o:P"o&o:- Es una muestra aleatoria pe#ue'a. El tama'o estará en "unc "unció ión n de la +omo +omo%e %ene neid idad ad o +ete +etero ro%e %ene neid idad ad de la in"ormación en estudio. (a Estadística no nos alcanza ci"ras sobre su tama'o. Es pe#ue'a y aleatoria. TIPOS DE MUESTREO  na mues muestr tra a no es alea aleato tori ria a cuan cuando do los los Mu$% Mu$%&. &.$o $o No A$ $!& !&o. o."o "o::- na elem elemen ento toss son son ele% ele%id idos os por por medi medio o de m/to m/todo doss no alea aleato tori rios os.. Este Este procedimiento está su&eto a errores ya #ue se con"ía al &uicio sub&etivo de seres +umanos, como en el caso de la selección diri%ida 0 no aleatoria1, donde las unidades son tomadas en "orma capric+osa y en la mayoría de las veces por conveniencia2 tal sucede en las encuestas de opinión #ue realizan los locutores deportivos, cuando se &ue%a un partido de "3tbol o en las entrevistas para televisión, radio o prensa, +ec+as en las principales vías de las ciudades, con el ánimo de conocer la opinión sobre al%3n asunto de inter/s para la comunidad. La muestra muestra dirigida dirigida está constituida por una parte de la población #ue el investi%ador considera representativa del universo, como en el caso de seleccionar diez 0451 "amilias ubicadas en un barrio de la ciudad, para #ue opinen sobre la se%uridad o medidas de vi%ilancia en la zona. ambi/n pudo +aberse +ec+o un llamado a las "amilias del barrio para #ue se presentaran voluntariamente a dar su opinión2 en este caso el proceso se denomina muestreo de voluntarios. i la característica es +omo%/nea, la representatividad de la muestra puede ser satis"actoria2 por e&emplo en un restaurante, una cuc+arada de sopa o un sorbo de vino2 en un almac/n, un trozo de tela o un par de zapatos, son representativos del total de la sopa preparada, del vino para la venta o de la tela o calzado de #ue dispone el establecimiento. i se desea practicar  e$amen de san%re a un paciente, el resultado será el mismo aun#ue la muestra varíe de 4 cm3  a un litro. 9ay otros m/todos de muestreo no aleatorio como6 el opinàtcio, la unidad se selecciona en opinión del investi%ador2 el intencional, +ay intención al seleccionar2 por cuotas; ya #ue se le dice al entrevistador cuántos +ombres, mu&eres, cuantos casados, solteros se deben entrevistar, es decir, se le "i&a cuotas2 de todas maneras es un muestreo sin validez, por esa razón se llama erróneo, conduce a errores.  Mu$%&.$o A$!&o."o:- na muestra es aleatoria cuando los elementos #ue constituyen la población o universo tienen la misma posibilidad de ser  seleccionados. E$isten numerosos procedimientos en la aplicación del muestreo aleatorio. (os más importantes son6 01- Mu$%&.$o A$!&o."o S",2$:- 7on reposición de las unidades, corresponde a una distribución binomial2 sin reposición, a una distribución +iper%om8trica. Este m/todo de muestreo aleatorio simple es recomendable, en especial, cuando la población no es numerosa y las unidades se concentran en un área pe#ue'a2 por otra parte, la característica no debe tener %ran variabilidad, por#ue implicaría un tama'o muestral muy amplio #ue, a su vez, incrementará costos y tiempo2 por 3ltimo, la población debe "acilitar su enumeración para #ue permita la aplicación de este m/todo. (as anteriores observaciones conllevan a "i&ar tres inconvenientes #ue presenta el m/todo de muestreo aleatorio simple. a. e re#uiere un listado de unidades de la población, lo cual no es "ácil, en muc+os casos 0 ,!.(o51 b. i el área es amplia, es probable #ue +aya necesidad de traslado a lu%ares le&anos, para investi%ar unas pocas unidades, di"icultando su aplicación 0costo y tiempo1. c. No e$iste %arantía de #ue todas las unidades #ueden representadas en la muestra, cuando la característica tiene una %ran variabilidad. d. i el coe"iciente de variación es mayor del :5; el tama'o de la muestra se va +aciendo más %rande. 31- Mu$%&.$o A$!&o."o E%&.!&"4"(!do:- se le domina tambi/n como muestreo aleatorio restrin%ido. Este procedimiento implica una división de la población en %rupos, denominados estratos, en tal "orma #ue el elemento presenta una característica tan de"inida #ue sólo le permitirá pertenecer a un 3nico estrato. Por lo tanto, para #ue la división por %rupos sea e"ectiva, los "actores de estrati"icación deberán %uardar estrec+a relación con las características #ue se investi%an y con el ob&etivo o "inalidad del estudio. )e esta manera se lo%ra una mayor precisión en los resultados. upon%amos #ue se #uiere +acer una investi%ación sobre el transporte urbano en una determinada ciudad, con el "in de establecer los costos de operación por pasa&ero. En este caso, una muestra aleatoria simple de :55 ve+ículos no nos da %arantía de #ue los di"erentes tipos de ve+ículos, buses, busetas, micros y colectivos #ueden bien representados en la muestra, si se tiene en cuenta #ue puede +aber %randes di"erencias, no sólo en cuanto a capacidad del ve+ículo, sino en su recorrido. En este caso, es pre"erible establecer estratos o %rupos mediante la clasi"icación se%3n el tipo del ve+ículo. En el muestreo aleatorio Estratificado, como en el muestreo aleatorio simple, se re#uiere una lista detallada de las unidades #ue constituyen la población a "in de elaborar los estratos o subpoblaciones pero a pesar de lo dispendioso #ue puede resultar este procedimiento, +ay %arantía de #ue los elementos de la población #ueden bien representados en la muestra. Este m/todo es más e"iciente #ue el muestreo aleatorio simple, pese al %rado de +etero%eneidad y dispersión #ue puede presentar l a característica, con la venta&a de #ue al "ormar %rupos más o menos +omo%/neos, las muestras resultantes son más pe#ue'as y representativas. Mediante la selección aleatoria, en cada uno de los estratos se con"ormará la muestra. )ependiendo de la distribución o esco%encia de los tama'os muestrales para cada estrato, podrán obtenerse mediante al%uno de estos tres procedimientos. !5 A4"6!(")n I'u! o A%"'n!(")n I'u!:- se da cuando los elementos #uedan asi%nados o repartidos por i%ual en cada estrato muestra. *5 A4"6!(")n P.o2o.("on! o A%"'n!(")n P.o2o.("on!:- los elementos se distribuyen en los estratos muestrales, en la misma proporción en #ue se distribuyen los elementos en la población. (5 A4"6!(")n 72&",!:- cuando el tama'o, tanto de la muestra %eneral como para cada uno de los estratos muestrales, dependen del %rado de variabilidad de la característica en cada estrato y del costo mínimo para una precisión dada. e debe tener en cuenta #ue6 si el coe"iciente de variación ( s / x ) es menor  o i%ual al :5; se debe realizar el muestreo aleatorio simple2 si por el contrario es mayor a dic+o valor2 el tama'o de la muestra va creciendo, obli%ando a aplicar el muestreo aleatorio estrati"icado con el cual disminuiremos tiempo, costo y además, una mayor precisión en la estimación. 81- Mu$%&.$o S"%&$,á&"(o:- más #ue un m/todo, es considerado como un m/todo de selección, al #ue al%unos denominan m/todo de selección a intervalos re%ulares. e aplica cuando la característica a investi%ar se encuentra ordenada por valor, tiempo, cantidad, etc. Prácticamente sobre los : m/todos anteriores, muestreo aleatorio simple, muestreo aleatorio estrati"icado y muestreo sistemático no son los 3nicos tipos de muestreo2 e$isten otros m/todos, no estudiados con amplitud, dado lo e$tenso de ellos. 91- Mu$%&.$o Do*$:- denominado tambi/n bifásico por#ue se e"ect3a en dos "ases. Es aplicado de pre"erencia, cuando no e$iste in"ormación au$iliar  #ue permita conocer los tama'os poblacionales de los estratos, ni la identi"icación de las unidades2 en este caso, primero se realiza una muestra aleatoria simple, %eneralmente %rande, en "orma rápida y sencilla para conocer en "orma muy %eneral al%unas de las características ob&eto del estudio, lue%o se procede a una se%unda muestra e$traída de la anterior, la #ue podría considerarse como submuestra con la cual se +acen las estimaciones. i se utilizan más de dos "ases, se +abla de muestreo m3ltiple o poli"ásico. 1- Mu$%&.$o 2o. Con'o,$.!do% o ;.$!%:- en los m/todos anteriormente e$puestos es necesario contar con un listado de unidades "inales o unidades elementales de la población. El muestreo por  con%lomerados se utiliza cuando o bien, no e$iste listado, o las unidades están demasiado dispersas. Esto nos obli%a a sustituir las unidades "ísicas o elementos, por %rupos de unidades, #ue llamaremos con%lomerados2 %eneralmente son super"icies o áreas en las #ue se +a dividido el espacio ocupado por la población. upon%amos #ue se desean realizar estudios a "amilias en una ciudad. 7ada unidad o "amilia se constituye en un con%lomerado, por tal razón se aplica el muestreo aleatorio monoet&odo% M"?&o%:- son el resultado de la combinación de al%unos o de todos los m/todos anteriormente mencionados. MARCO Para la selección de las unidades se re#uiere de un listado, #ue en al%unos casos debe prepararse, en otras, tan sólo se actualiza. Este listado debe corresponder al total de las unidades o elementos #ue inte%ran la población a investi%ar o a seleccionar #ue, a su vez, constituyen el marco de referencia o marco muestral , constituido por la población ob&etivo. Por  e&emplo, la nómina de pa%o, ya sea para un %rupo de traba&adores en una "ábrica o reempleados en una empresa, podría ser el marco2 otro e&emplo podría ser el listado de matrículas de los estudiantes en una universidad. in embar%o, el marco no siempre estará representado por un listado, podría ser tambi/n un mapa o "oto%ra"ías a/reas. En el marco no deben aparecer unidades "alsas2 e&emplo6 en el listado de matriculas no deben "i%urar a#uellos estudiantes #ue se +an realizado por di"erentes causas, pero #ue se alcanzaron a matricular. En el muestreo por etapas m3ltiples, debe e$istir un m arco para cada etapa. En marco en cada etapa, debe ser su"iciente detallado en cuanto a la identi"icación de sus unidades de tal manera #ue si una de ellas es incluida en la muestra, puede ser ubicada e investi%ada rápidamente sin #ue ello impli#ue #ue se especi"i#ue la in"ormación #ue debe suministrar cada unidad. Rara vez los marcos son per"ectos y lo com3n es #ue sean ine$actos, inadecuadamente descritos, desactualizados o con unidades duplicadas2 por tal motivo, deben ser revisados y actualizados de manera #ue permitan una "iabilidad razonable por cuanto la muestra se basa en ellos. OB@ETIVOS DEL MUESTREO ALEATORIO El ob&etivo del muestreo aleatorio es seleccionar una parte representativa de la población con el "in de obtener estimadores de los parámetros. Para lo%rarlo e$isten varios m/todos y en cada uno de ellos se puede establecer6 a1 El %rado de precisión re#uerido en los estimadores. b1 ama'o de la muestra. c1 7osto y tiempo. E%&",!do.$%:- el estimador es una medida #ue describe una característica de la muestra, obtenida mediante la aplicación de promedios, proporciones, tasas, razones, varianzas, desviaciones típicas, etc. e les llama estimadores,   ya #ue se les considera como el me&or valor #ue sustituye a los valores num/ricos poblacionales, %eneralmente desconocidos, a los #ue se lle%a por medio de datos proporcionados por la muestra, , en tanto #ue un parámetro describe una determinada característica de las unidades en la población. (os estimativos obtenidos a trav/s de una muestra pueden considerarse como el comportamiento de esa característica en toda la población. (a estimación de los parámetros se +ace a partir de los estadí%ra"os calculados en una muestra, con los cuales se obtienen conclusiones, #ue permiten, ala vez, la realización de pruebas de +ipótesis, proceso denominado inferencia estadística. i para cada parámetro desconocido se calcula una ci"ra 3nica, la estimación se denomina puntual o estimación de punto. ise establece un intervalo o ran%o de valores, dentro de los cuales se espera encontrar el parámetro, con cierto %rado de con"ianza, se le denomina estimación de intervalo. (os límites #ue de"inen el intervalo se conocen como limites de confianza . n buen estimador debe reunir cuatro condiciones o propiedades6 a. In%$%'!do:- se dice si un estimador es inses%ado, si el valor esperado del mismo es i%ual al parámetro de la población #ue estima. b. E4"("$n&$:- se re"iere a lo cerca #ue se encuentre el valor estimado del parámetro. c. Con%"%&$n&$:= se obtiene cuando el tama'o de la muestra se incrementa en tal "orma #ue la varianza desminuya, siendo menor la di"erencia entre el valor real y el estimado. d. Su4"("$n&$: es un estimador #ue utiliza toda la in"ormación #ue posee una muestra sobre el parámetro #ue se estima. T!,!o d$ ! ,u$%&.!:- una de las decisiones más importantes #ue se deben tomar en una investi%ación por muestreo, consiste en la determinación del tamaño óptimo, simbolizado por n1 e dice #ue una muestra debe ser  pe#ue'a, con el "in de #ue el costo de la investi%ación sea lo su"icientemente ba&o, y bastante %rande para #ue el error del muestreo sea admisible. Al%unos creen #ue el tama'o de la muestra crece independientemente a medida #ue aumenta el tama'o poblacional, simbolizado por N, pero eso no es cierto, ya #ue e$iste un punto en el cual el tama'o de la muestra permanece constante, así el tama'o poblacional aumenta. En el cálculo del tama'o óptimo, se deben tener en cuenta, los si%uientes componentes6 05 E $..o. d$ Mu$%&.$o:- es la di"erencia #ue puede +aber entre el valor  poblacional y la estimación de la misma 0estimación puntual o estadí%ra"o1, obtenida por medio de una muestra aleatoria, observada en una de las tantas muestra posibles de una población dada. (a totalidad de estos errores, %enera la distribución de muestreo empleada para estimar el valor  poblacional. ±  E  = x −  µ   µ  =  x ±  E  = Media muestral  µ  = Media poblacional.  x En muc+os casos, el error será determinado por el investi%ador, por  e&emplo6 si para un sector de la economía se #uiere estimar el promedio de salarios y se sabe por observaciones aisladas o por e$periencia, #ue el in%reso promedio para ese sector es, apro$imadamente, de >?5.555, el error respecto al parámetro podría ser6 >?5.555 ±   E. de acuerdo a la "inalidad de la investi%ación podría considerarse, para este caso, #ue un error de ± @5.555 o cual#uier otro valor es más #ue su"iciente, dado el %rado de variabilidad #ue supuestamente ten%an los salarios en dic+o sector. in embar%o, este procedimiento re#uiere, además de cierta e$periencia, un conocimiento previo sobre el comportamiento de la característica en la población #ue se estudia, de a+í #ue es muc+o más practico determinar el error como un porcenta&e, en la mayoría de los casos no mayor del 45;, aplicando a la medida aritm/tica, %eneralmente obtenida en una encuesta preliminar6  E  = (%)( x ) El porcenta&e podría considerarse en al%unos casos como un complemento del nivel de con"ianza así #ue una con"ianza del B; daría un error del B;, pero no siempre será el complemento, ya #ue este porcenta&e podrá aumentarse o disminuirse dependiendo del %rado de precisión con #ue se desea +acer la estimación. Pero +ay otro tipo de error #ue no tiene nada #ue ver con el muestreo y #ue no se puede medir. Estos errores denominados !6$no% ! ,u$%&.$o+ no ,u$%&.!$% o %"%&$,á&"(o%, se consideran como el resultado de instrumentos de medición incorrectos, cuestionarios mal de"inidos, errores #ue comete el entrevistador al e"ectuar las pre%untas o al interpretar las respuestas, pre%untas va%as o ambi%uas2 en otros casos, son consecuencia de la in"luencia ne%ativa del entrevistador, del mal dise'o del "ormulario. ambi/n podría ser el resultado de los procesos de crítica, codi"icación, tabulación, en los cuales se pueden cometer errores a&enos al muestreo. 35 L! #!."!n!:- del %rado de variabilidad, varianza, depende en %ran parte el tama'o de la muestra. Por e&emplo, el m/dico #ue realiza un análisis de san%re, el panadero #ue se come un pan, el cocinero #ue paladea una cuc+arada de sopa2 cada uno de ellos +a +ec+o uso de una muestra. !bs/rvese #ue con un centímetro de san%re, un pan o una cuc+arada de sopa se puede determinar el comportamiento de la totalidad 0san%re del paciente, total de panes producidos en una &ornada, total de sopa preparada para el almuerzo1 y se debe al %rado de +omo%eneidad #ue presenta la característica observada2 cual#uier muestra #ue se tome de estas poblaciones se espera #ue d/ un resultado i%ual, representativo del total. i todas las características presentaran un alto %rado de +omo%eneidad, sería muy sencilla la investi%ación por muestreo, pero esa situación no seda en la mayoría de las poblaciones #ue se investi%an2 por lo tanto el tama'o de la muestra deberá aumentarse de acuerdo al %rado de variabilidad, de tal "orma #ue #ueden representados en ella los valores e$tremos #ue toma la variable. En el cálculo del tama'o de la muestra, lo ideal sería #ue la varianza correspondiera a la población investi%ada, pero en la mayoría de los casos esto no es posible, de a+í #ue e$ista la necesidad de estimarla mediante6 a1. Encuestas preliminares, piloto o pretest, sistema #ue consiste en la realización de una pe#ue'a encuesta, cuyo tama'o por lo %eneral se toma en "orma abierta, "i&ándose un porcenta&e #ue debe ser aplicado al tama'o poblacional. Esta varianza resultante de la encuesta se considera #ue puede ser un buen sustituto al de la población. b1. El empleo de la varianza, obtenida en censos o investi%aciones similares, realizadas con anterioridad. c1. !tras veces son el resultado de con&eturas sobre la población. (as encuestas preliminares permiten no sólo estimar la varianza de las características de a#uellas variables #ue tienen #ue ver con el ob&etivo de la investi%ación, sino #ue "acilitan su conocimiento, "amiliarizan al entrevistador al aplicar el "ormulario, determinan las "allas del mismo, además, se puede conocer la reacción del entrevistado, el tiempo necesario para cada entrevista y, como se de&o anteriormente, permite el cálculo del error necesario para "i&ar el tama'o óptimo de la muestra. )e i%ual modo la encuesta preliminar permite +asta cierto punto, probar  %ran parte de los mecanismos t/cnicos de muestreo, establecer los costos, localizar las unidades, comprobar si la medición es e$acta, etc. 85 L! (on4"!n!: se +a mencionado el %rado de precisión, depende de al%una manera, del tama'o de la muestra y /ste, a su vez, de "actores tales como el error, la varianza, la con"ianza. Esta ultima es "i&ada por el investi%ador, #uien por lo %eneral, traba&a con una z C D, valor correspondiente a un nivel de con"ianza del B.B;2 pero es posible #ue sean otros los valores de , tales como6  C D.BF 0con"ianza del ;1 y  C 4.@> 05; de con"iabilidad1. (o más práctico es traba&ar con C D o  C 4.@, pero de todas maneras la decisión si%ue dependiendo de la "inalidad y del %rado de precisión #ue se desee. 95 T!,!o d$ ! 2o*!(")n:- es el 3ltimo componente de la "ormula, para calcular el tama'o optimo de la muestra, cuando se trata de poblaciones "initas. DISEÑO DE MUESTREO El dise'o y el tama'o de la muestra nos van a determinar la cantidad de la in"ormación necesaria respecto a los ob&etivos de la encuesta. Recordemos #ue el ob&etivo del muestreo es contar con el mayor n3mero de unidades, con la mayor cantidad de in"ormación, pero al menor costo posible.  A veces se cree #ue con muc+a in"ormación se lo%ran buenas estimaciones2 sin embar%o, %eneralmente ocasionan despil"arro de dinero, p/rdida in3til de tiempo y complicaciones en la or%anización y análisis de los datos. !tras veces se peca por poca in"ormación, #ue +ace temer por el /$ito de la investi%ación. (os dos casos se deben a #ue la muestra no "ue correctamente dise'ada. Para el dise'o de la muestra y cálculo del tama'o, se re#uiere #ue se +ayan adelantado al%unas etapas, tales como6 a1 P!n&$!,"$n&o d$ P.o*$,!:- nos permite determinar la necesidad, o no, de adelantar una investi%ación #ue permita reco%er o utilizar  in"ormación #ue proporcione un mayor conocimiento del problema, aclarar al%unas in#uietudes y tener más +erramientas de &uicio para la toma de decisiones. upon%amos #ue se tiene planteado como e&ercicio de aplicación6 el problema de la mala calidad de la lec+e, la ba&a nutrición de los ni'os, el precio elevado de este producto y su distribución. b1 Un! #$ d$&$.,"n!d! ! n$($%"d!d d$ .$!"!. ! "n#$%&"'!(")n+ debe establecerse el objetivo o los objetivos, de una manera clara y precisa, los cuales no deben perderse de vista, y si ser tenidos en cuenta a medida #ue se vaya avanzando, tanto en el dise'o como en la instrumentación de la encuesta. En nuestro caso, el e&ercicio #ue nos permitirá aplicar al%unos de los m/todos de muestreo, la realización de estimaciones e interpretación de las mismas, consiste en considerar #ue el ob&etivo principal del estudio es investi%ar el consumo de carne en uno de los barrios de la ciudad2 como ob&etivos secundarios nos interesa conocer6 las variaciones en el consumo2 composición y niveles de in%reso de la "amilia2 además, se busca in"ormación sobre la calidad, precios, consumo de pescado y pollo, distribución, entre otros. c1 D$*$,o% d$&$.,"n!. ! 2o*!(")n o*6$&"#o+ #ue debe estar  claramente de"inida y plenamente identi"icable al iniciar el proceso de selección y la entrevista. Gmplica identi"icar la unidad o el elemento, la cual debe ser6 clara, mensurable, adecuada y comparable. En nuestro problema, la unidad corresponde a a#uellas "amilias #ue viven en el barrio ob&eto de investi%ación. !bservemos #ue la "amilia es, en nuestro caso, la unidad de selección. d1 Fo.,u!,o% ! "2)&$%"%+ ya sea para a"irmar o rec+azar. Anotaremos como e&emplo al%unas de ellas, al considerar la mala calidad de la lec+e. = 9ay tendencia a consumir lec+e de marca. = e observan variaciones en las cantidades compradas, "rente a variaciones de precios y marcas. = El consumo de lec+e aumenta con la población escolar. = (a posesión de neveras in"luye en los +ábitos de compra. = El consumo de lec+e por persona es ba&o en comparación con el mínimo nutricional recomendable. e1 S$ $!*o.! $ ,!.(o d$ .$4$.$n("!1  Recordaremos #ue es un listado detonas las unidades #ue constituyen la población ob&etivo, y puede corresponder a un mapa o cro#uis #ue indi#ue la localización de las unidades. En nuestro e&ercicio con el cual desarrollamos la teoría. El marco estará constituido por :BB "amilias, #ue además de estar  completamente localizadas, se encuentran numeradas desde 554 +asta :BB. "1 S$ $%&!*$($ $ ,>&odo d$ .$(o$((")n+ teniendo en cuenta las venta&as y desventa&as #ue presenta cada uno de ellos, #ue nos permita +acer una buena selección. Al%unos de estos m/todos son6 la entrevista, el correo, la entre%a personal del cuestionario, el tel/"ono y el panel. Para nuestro caso, se +a considerado la entrevista como el m/todo de recolección mas indicado. %1 S$ %$$(("on!.! $ ,>&odo d$ ,u$%&.$ !$!&o."o+ dependiendo de la variabilidad #ue presenta la característica principal #ue tiene #ue ver con el ob&etivo de la investi%ación. +1 A $%&! !&u.! %$ !n d$%!..o!do o&.!% $&!2!% &!$% (o,o: la elaboración del instrumento de recolección, la selección y preparación del personal, se +a +ec+o el e$amen de la documentación en especial para determinar si este tipo de estudio ya "ue realizado y si e$iste al%una metodolo%ía #ue se +aya aplicado a una investi%ación similar, con buenos resultados2 además, se cuenta con los recursos necesarios #ue permitan el buen desarrollo y terminación del traba&o. En el dise'o y determinación del tama'o de la muestra se +icieron al%unas consideraciones #ue se deben tener en cuenta en una investi%ación, siendo una de ellas el %rado de +omo%eneidad #ue presenten las características #ue se vana investi%ar, pues nos permite tomar decisiones respecto al m/todo de muestreo #ue debe corresponder a la investi%ación #ue repiensa realizar. FORMULARIO O CUESTIONARIO e prepara un instrumento con el "in de reco%er la in"ormación necesaria, de acuerdo a los ob&etivos establecidos en la investi%ación. Este debe ser  sometido a prueba, realizando una encuesta preliminar o piloto, cuyo tama'o "ue ele%ido por el investi%ador teniendo en cuenta "actores tales como6 población, ob&etivo, costos, tiempo y recursos +umanos. En el caso de #ue se ten%a una población de :BB "amilias, ubicadas en un determinado sector de la ciudad, el tama'o de la muestra preliminar será6   n C 0;1 0N1 o sea n C 0.04 (355)=14 "amilias. Recordemos #ue el ; lo determina el investi%ador. Presentamos a continuación una parte del "ormulario y se%uidamente el ,!.(o o listado de las:BB "amilias 0incluimos la in"ormación de al%unas características #ue lue%o serán recolectadas, tanto para la muestra piloto como la de"initiva con la cual se +arán los estimativos1. R$!"!d! $ d$2!.&!,$n&o d$ "n#$%&"'!(")n ("$n&4"(! N 0 ENCUESTA SOBRE INGRESOS Y CONSUMO DE LAS FAMILIAS EN EL BARRIO11 )irección el/"ono HHHHHHHHHH. 7iudad HHHHHHHHHH. HHHHH Iec+a HHHH. G JENERA(G)A)E Nombre del in"ormante6 )irección !cupación KKKKKKKKKKKKKKKKKKKKKKKKKKKKKKK KKKKKKKKKKKKKKKKKKKKKK el/"ono KKKKKKKKKKKKKKKKKKKKKK Edad KKKKKKKKKK   KKKKKKKKKK   GGHHH.. 4, Gn%reso mensual D, Propiedad de la vivienda KKKKKKKKKKKKKKKKKKKKKKKKKKKKKK D,4 D,D :, 7onsumo diario carne KKKKKKKKKKK Jramos Propietario Gn#uilino i se "uera +acer una investi%ación total, la in"ormación sobre al%unas características6 in%reso 0miles de L12 propiedad de vivienda2 total personas por  se$o y ocupación2 y consumo de carne diaria 0en %ramos1 se tendría en la si%uiente tabla6 D!&o% (o..$%2ond"$n&$% ! 8 4!,""!% Hu$ .$%"d$n $n $ *!.."o  F!,""!. N 554 55D 55: H.. H.. 5B4 5BD 5B: H.. H.. 45B H.. 4B H.. :B: :B> :BB In'.$%o% ,"$% K5 4?@ :?> D H.. H.. 4DB :?@ 4?? H.. H.. 4@ H.. 4D@ H.. 4FB : 4>B V"#"$nd! P.o2"! si no no H.. H.. si no no H.. H.. si H.. no H.. si no si NJ,$.o d$ P$.%on!% To&! M F T.!*!6!ndo B : D D @ D > : : 4 D 4 H.. H.. H.. H.. H.. H.. H.. H.. D 4 4 4 B D ? : : 4 D D H.. H.. H.. H.. H.. H.. H.. D 4 4 D H.. H.. H.. H.. : 4 D 4 H.. H.. H.. H.. : D 4 D 4 4 5 4 D 4 4 4 Con%u,o D"!."o d$ (!.n$ '.%15 F? ?5F ?5D H.. H.. FB5 FB5 ??5 H.. H.. @B5 H.. B4@ H.. B4B BD> B:5 Mu$%&.$o !$!&o."o %",2$ M1A1S5 T!,!o d$ ! Mu$%&.! Cá(uo d$ T!,!o d$ ! ,u$%&.! (u!ndo no %$ (ono($ ! V!."!n! Po*!("on!:- En la práctica es muy "recuente #ue no se conozca la varianza de la característica en la población 0 S 2 12 en tales casos se debe recurrir a censos, a investi%aciones similares realizadas con anterioridad o a investi%aciones preliminares, denominadas encuestas piloto. Este 3ltimo procedimiento es el #ue más se emplea para determinar el tama'o de la muestra, partiendo del supuesto de #ue no e$iste in"ormación sobre la población. En primer lu%ar, se elabora un listado de "amilias a investi%ar y #ue con"orman el marco muestral, tal como aparece en el cuadro precedente. )espu/s de +aber identi"icado la población a la cual se va a investi%ar, de"inida claramente la unidad de investi%ación y las características #ue tiene #ue ver  con el estudio, se procede a establecer el tama'o óptimo para la muestra. Para dise'ar la muestra es indispensable contar con un marco de re"erencias, es decir, la lista, mapa u otra especi"icación de las unidades, #ue resulta de la in"ormación previamente disponible respecto a la población sobre la cual se basan los es#uemas particulares de muestreo. En nuestro caso el marco estará constituido por una lista de :BB "amilias. (a "amilia o unidad de investi%ación se +a de"inido como el con&unto de personas, 0del barrio 1 #ue viven ba&o un mismo tec+o, li%adas por un lazo de consan%uinidad y dependencia económica. na vez identi"icada y enumerada la población se procede a calcular el tama'o de la muestra, mediante la "órmula6 041 n= n0 n )onde n0 1+ 0  N  2 = 2  Z  S  2  E  2 0D1 n = 2  NZ  S  2 2 0:1 2  NE  +  Z  S   E  = S 2  E  ( )2  Z  2 + S   N    7omo se conocen las varianzas poblacionales de una o al%unas de las característicos #ue tienen #ue ver con el ob&etivo principal de la investi%ación, se procede a estimarlas mediante una encuesta piloto o preliminar, siendo6 n piloto 4   =       100   n piloto= 4 100 (355) = 14 El porcenta&e del >; es arbitrario, es una decisión del investi%ador, en al%unos casos depende, del tama'o poblacional, tiempo y costos. na vez establecido el valor n piloto  , se utiliza cual#uier M1A1S1 Mu$%&.$o !$!&o."o %",2$5 donde las unidades se seleccionan sin reposición, es decir, con i%ual probabilidad de selección. (ue%o se procede a seleccionar, en este caso mediante el uso de la calculadora, las 4> "amilias #ue "ormarán la muestra piloto, 0la población está numerada desde 554 +asta :BB1, sin tomar n3meros superiores o repetidos. upon%amos #ue se obtuvieron los si%uientes n3meros aleatorios con los cuales debe prepararse la tabla6 ::B 55> D? 4D? 5F DF4 DB: :>? D5D :> 4F 54? 5D5 D5F In4o.,!(")n o*&$n"d! ,$d"!n&$ L! En(u$%&! P.$","n!. o P"o&o N NJ,$.o% In'.$%o% V"#"$nd! O.d$n A$!&o."o% ,"$% K5 4 ::B D>D D 55> 45@ : D? D?@ > 4D? D:D B 5F 44D @ DF4 DB5 F DB: 4: ? :>? 45D  D5D 4@ 45 :> 44 44 4F F 4D 54? 4F 4: 5D5 DDB 4> D5F 4FB P.o2"! si si no no si si si si si no no no no si N To&! d$ 2$.%on!% : : : : : B D : D D D > : D M F T.!*!6!ndo 4 4 4 4 4 4 5 D 4 5 4 D 4 5 D D D D D > D 4 4 D 4 D D D 4 4 D D 4 D D 4 4 4 4 4 D 4 Con%u,o D"!."o d$ (!.n$ '.%15 F@5 F@B BD BD5 @45 @:@ @B5 @5B @>D BD5 B5? F@F ?>D @?> 7on la anterior in"ormación se determina la varianza y se calcula el tama'o óptimo de la muestra dependiendo de las características #ue +ayamos seleccionado. eamos los resultados, cuando traba&amos con un error de muestreo del B; para las variables 0Gn%reso y consumo1 y del ?; para el atributo 0propiedad de la vivienda1. (a con"ianza en los tres casos será del B.B; 0CD1. a1 in%reso promedio 0miles de pesos1  x = ∑  xi n =  ∑ xi  s 2 = 2 2506 14 − n x n −1 n0 n= =  Z 2 S 2  E 2 = = 179 2 =  E  = 0.05( x ) 501.554 − 14(179) 2 14 − 1 22 ( 4.075,38) 92 = 181.11 181.11 n0 = = 120 familias n0 181.11 1+ 1+ 355  N  = 0.05(179) = 4.075,38 = 9 0Nueve mil pesos1 2 = n 2  NZ  S  = +  Z 2 S 2 2  NE  355 ( 2 2 )( 4.075,38) 355 (9 2 ) + 2 2 120  familias ambi/n se puede calcular mediante6 = n S 2 + S 2 /  N  ( E / Z ) 2 = 4.075,38 (9 / 2) 2 + 4.075,38 / 355) = 120  familias  Al%unos utilizan la "ormula con corrección, ya #ue se considera #ue la varianza obtenida mediante una encuesta preliminar, cuando está es muy pe#ue'a, se +ace poco representativa, es decir, #ue el resultado de n es menor #ue el obtenido con varianza poblacional. Procedemos al cálculo de n con corrección6 n0  Z 2 S 2   2   22 (4.075,38)   2  =  2  1 +  =   1 + 14  = 206,98 2  E  n 9  1     n = 206 ,98 206 ,98 1+ 355 = 131  familias El tama'o de la muestra obtenida al corre%ir va a ser un poco mayor #ue cuando no es corre%ida. i "uera necesario calcular el total de in%resos de las :BB "amilias, el tama'o de la muestra arro&aría los mismos resultados anteriores, a pesar de #ue la "órmula se modi"ica6 2 = n0 n0 b1 = 2 2  Z   N  S  2  E  =  N (0.05)( x ) = 3055(9) 2 2 (355)( 4.075 .38) 3.195 2 n = 650 .07 = 181 .11 181,11 1+ 94  s 2 = ∑  xi n  ∑ xi = = 2 9.101 14 − n x n −1 3.195 = 120  familias 7onsumo promedio de carne diaria por "amilia  x =  E  = 650.07 2 = 6054.547 − 14(650,07) 2 14 − 1 = 10.634,38 s C 45:.4D E C 5.5B 0  x 1 C 5.5B [email protected] C :D.B5 n0 =  Z 2 S 2 2  E  = 2 2 (10 .634 ,38 ) = 40,26 , 1.056 , 48 n=  E 2 = 1.056,48 n0 40,26 =   = 37 familias n0 40,26 1+ 1+  N  355 ambi/n se puede calcular mediante la "órmula6 n= SZ 2 S 2 2 2 n= 2  NE  +  Z  S  355 ( 2) 2 (10 .634 ,38 )   355 (32,50 ) 2 + 2 2 (10 .634 ,38) = 37 familias !tra "orma de calcular el tama'o óptimo, es así6 n = S 2   E   + S 2 2 siendo6      Z     N  2 n = 10 .634 ,38 2  32.5   + 10 .634 ,38    355   2   = 37  familias 7uando +ay cierto %rado de +omo%eneidad en la característica investi%ada, el tama'o tiende a ser pe#ue'o, tal es el caso observado con el consumo de carne diaria donde se obtuvieron :F "amilias. El %rado de +omo%eneidad seda cuando el coe"iciente de variación es menor del :5;2 en estos casos es recomendable la aplicación del  uestreo !leatorio "imple. CV  =  s  x 100 CV  = 103 .12 650 .07 100 = 15.89% En el caso del in%reso por "amilia se puede observar #ue el 7 es del :@;, superior ! 8, establecido, por tal razón, la muestra obtenida debe ser mayor  a la del consumo, siendo n C 4D5 "amilias. Nos #uedan dos alternativas, si la característica principal es el in%reso, debemos traba&ar con las 4D5 "amilias, lo cual implica un mayor costo, tiempo y recursos +umanos, o aplicar el m/todo de Muestreo Aleatorio Estrati"icado, disminuyendo los tres "actores antes mencionados2 además, se obtiene una me&or estimación. c1 Proporción de "amilias con vivienda propia6  P  = n0  ∑ a n  Z 2 PQ = 2  E  = i =  Z 2 S p 2 8 14 = 0.57  s p 2 = pq = 0.57 (0.43) = 0.2451 2 2 n0  E  n= = 2 2 (0.2451) 0.082 n0 153.18 = = 107 familias n0 153.18 1+ 1+  N  355 ambi/n6 2 n = 2 SZ  S  2  NE  +  Z 2 PQ = 355 ( 2) 2 (0.57 )( 0.43) 355(0.08) 2 + 2 2 (0.57 )(0.43) = 107  familias  E  = 8% = 153.18 2 = 0.08