viernes, 13 de noviembre de 2015

DISTRIBUCIONES MUESTRALES

  • MISION DE LA UNIVERSIDAD NACIONAL FEDERICO VILLAREAL:
"La Universidad Nacional Federico Villarreal" tiene por misión, la formación de la persona humana, y el fortalecimiento de la identidad cultural de la nación, fundado con el conocimiento científico y tecnológico, en correspondencia con el desarrollo humano sostenible.


  • VISION DE LA UNIVERSIDAD NACIONAL FEDERICO VILLAREAL:
"La Universidad Nacional Federico Villarreal" será una comunidad académica acreditada bajo estándares globales de calidad, posicionada internacionalmente, y al servicio del desarrollo humano sostenible.




DISTRIBUCIONES MUESTRALES:

Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible) en repetidas muestras. Este patrón es llamado la distribución muestral de la estadística. Si conocemos la distribución muestral podemos hacer inferencia. Las distribuciones muestrales adoptan diferentes formas según las estadísticas investigadas y las características de la población estudiada.
Una distribución muestral es una distribución de Probabilidad de una estadística muestral calculada a partir de todas las muestras posibles de tamaño "n" elegidas al azar de una población determinada.

TIPOS DE DISTRIBUCIONES MUESTRALES:
·            Distribución de la media:
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se calcula la media muestral X para cada muestra; la colección de todas estas medias muestrales recibe el nombre de distribución muestral de medias, lo que se puede ilustrar en la siguiente figura:

·            Distribución muestral de la diferencia entre dos medias.
Una distribución muestral de las medias es de tipo probabilístico e indica cuán probables son diversas medias de la muestra. La distribución es una función de la media, de la desviación estándar de la población y del tamaño de la muestra.
El estudio de determinadas características de una población se efectúa a través de diversas muestras que pueden extraerse de ella.
El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita. Una población finita en la que se efectúa muestreo con reposición puede considerarse infinita teóricamente. También, a efectos prácticos, una población muy grande puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo con reposición. 
Consideremos todas las posibles muestras de tamaño n en una población. Para cada muestra podemos calcular un estadístico (media, desviación típica, proporción,...) que variará de una a otra. Así obtenemos una distribución del estadístico que se llama distribución muestral.
Las dos medidas fundamentales de esta distribución son la media y la desviación típica, también denominada error típico.
Hay que hacer notar que si el tamaño de la muestra es lo suficientemente grande las distribuciones muestrales son normales y en esto se basarán todos los resultados que alcancemos.


Suponga que se tienen dos poblaciones distintas, la primera con media y desviación estándar y la segunda con media y desviación estándar . Más aún, se elige una muestra aleatoria de tamaño n1 de la primera población y una muestra independiente aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada muestra y la diferencia entre dichas medias. La colección de todas esas diferencias se llama distribución muestral de las diferencias entre medias o la distribución muestral del estadístico.



·            Distribución de la variancia:
El supuesto fundamental es que la población tiene distribución normal con media y varianza. De esta población se obtiene una muestra aleatoria de tamaño n. La varianza de la muestra se define como:

                                
Si se multiplica por n/ se obtiene:

                              
La expresión (1.1) es similar a:


                                   
que tiene distribución chi-cuadrado con n grados de libertad. La única diferencia es que en el uno interviene la media muestral (x) y en el otro la media poblacional ( u ). Por lo tanto, la pregunta es si la expresión (1.1) también tiene distribución chi-cuadrado con n grados de libertad.
que tiene distribución chi-cuadrado con n grados de libertad. La única diferencia es que en el uno interviene la media muestral (x) y en el otro la media poblacional (  u). Por lo tanto, la pregunta es si la expresión (1.1) también tiene distribución chi-cuadrado con n grados de libertad.
Recordemos que una variable aleatoria con distribución normal estándar, elevada al cuadrado, tiene distribucion chi-cuadrado y sus grados de libertad dependen del número de observaciones.

Si una variable aleatoria X tiene distribución normal, N(u,O2), por el teorema central del límite:



·            Distribución de la proporción:
La distribucion muestral de proporciones es el conjunto de todas las muestras posibles del mismo tamaño extraídas de una poblacion, junto con el conjunto de todas las proporciones muestrales.
La distribución muestral de proporciones está estrechamente relacionada con la distribución binomial; una distribución binomial es una distribución del total de éxitos en las muestras, mientras que una distribución de proporciones es la distribución de un promedio (media) de los éxitos.
Ejemplo:
La distribución muestral de proporciones está estrechamente relacionada con la distribución binomial; una distribución binomial es una distribución del total de éxitos en las muestras, mientras que una distribución de proporciones es la distribución de un promedio (media) de los éxitos. Como consecuencia de esta relación, las afirmaciones probabilísticas referentes a la proporción muestral pueden evaluarse usando la aproximación normal a la binomial, siempre que: np ≥ 5 y n(1- p) ≥ 5 




Ver más ejemplos:  Clic Aqui!!


·            Distribución de la diferencia proporciones:
Este método se utiliza para comparar las proporciones o porcentajes de dos distribuciones muestrales distintas y formular una inferencia con respecto a la diferencia de estas. Sean X, X, X,... Xn e Y, Y, Y,….., Yn dos muestras aleatorias independientes de tamaños n y n seleccionadas respectivamente de dos poblaciones diferentes.
De dos poblaciones se toman dos muestras aleatorias independientes de tamaños n1 => 30 y n2  => 30, y en cada una de ellas se observa una característica o cualidad. La proporción muestral de elementos con una característica se define como:







·            Distribución del cociente de variancias:
De dos poblaciones con distribución normal y varianzas poblacionales O12 y O2se toman dos muestras aleatorias independientes de tamaños n1 y n2 .

Como se vió, en la distribución de la varianza se llega a una distribución chi-cuadrado y del cociente de dos chi-cuadrado se obtiene una distribución F de Snedecor.

Conocidas las distribuciones en el muestreo de los principales estimadores, se tiene la fundamentación teórica que nos permite desarrollar el tema correspondiente a los intervalos de confianza y las pruebas de hipótesis.


ERROR EN EL MUESTREO:
Tras entender la importancia de escoger una muestra representativa de la población, veamos que para lograr esto, podemos seleccionar, por ejemplo, una muestra aleatoria simple de la población, pero es muy improbable que la media de la muestra sea idéntica a la media de la población. De la misma manera, tal vez la desviación estándar u otra medición que se calcule con base en la muestra no sea igual al valor correspondiente de la población Por tanto, es posible que existan ciertas diferencias entre los estadísticos de la muestra (como la media o la desviación estándar), y los parámetros de población correspondientes. A dicha diferencia se la conoce como error de muestreo.


¿Por qué sucede este error?

El error del proceso de muestreo ocurre cuando los investigadores toman diferentes sujetos de la misma población, y aún así, los sujetos tienen diferencias individuales. Debes recordar que cuando tomas una muestra, se trata de un subconjunto de toda la población y, por lo tanto, puede haber una diferencia entre la muestra y la población.
La causa más frecuente de dicho error es un procedimiento de muestreo sesgado. Todo investigador debe tratar de establecer una muestra que esté libre de sesgos y sea representativa de toda la población. Así, el investigador es capaz de minimizar o eliminar el error de muestreo.
Otra causa posible de este error es la casualidad. Se lleva a cabo el proceso dealeatorización y muestreo de probabilidad para minimizar el error del proceso de muestreo, pero igualmente es posible que todos los sujetos asignados al azar no sean representativos de la población.
El resultado más común de error de muestreo es el error sistemático en donde los resultados de la muestra difieren significativamente de los resultados de toda la población. Se entiende que si la muestra no es representativa de toda la población, lo más probable es que los resultados de la muestra difieran de los resultados de toda la población.

 

Tamaño de la muestra y error de muestreo

Dados dos estudios exactamente iguales, dos métodos de muestreo iguales y la misma población, el estudio con un tamaño de muestra más grande tendrá menos error del proceso de muestreo que el estudio con un tamaño menor de la muestra. Debes recordar que a medida que aumenta el tamaño de la muestra, se acerca al tamaño de toda la población y, por lo tanto, se aproxima a todas las características de la población, disminuyendo el error del proceso de muestreo.

Desviación estándar y error de muestreo

La desviación estándar se utiliza para expresar la variabilidad de la población. Más técnicamente, es la diferencia promedio de todas las puntuaciones reales de los sujetos de la media o promedio de todas las puntuaciones. Por lo tanto, si la muestra tiene una alta desviación estándar, se deduce que la muestra también tiene un alto error del proceso de muestreo.
Se entiende más fácilmente si relacionas la desviación estándar con el tamaño de la muestra. Debes tener en cuenta que a medida que aumenta el tamaño de la muestra, la desviación estándar disminuye.
Imagina que tienes sólo 10 sujetos. Con este tamaño de la muestra tan pequeño, la tendencia de sus resultados es que variarán mucho, produciendo una alta desviación estándar. Ahora imagina que el tamaño de la muestra aumentó a 100. La tendencia de sus puntuaciones es a agruparse, produciendo una desviación estándar baja.

Formas de eliminar el error de muestreo

Sólo hay una manera de eliminar este error. Consiste en eliminar el concepto de muestra y probar a toda la población.
En la mayoría de los casos esto no es posible. Por consiguiente, lo que el investigador debe hacer es minimizar el error del proceso de muestreo. Esto se puede lograr con un muestreo probabilístico adecuado y no sesgado y mediante el uso de un gran tamaño de la muestra.

 


BIBLIOGRAFIA: