Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Guía Práctica para Pruebas de Hipótesis en Estadística, Guías, Proyectos, Investigaciones de Estadística

espero les sirva este documento

Tipo: Guías, Proyectos, Investigaciones

2021/2022

Subido el 08/12/2022

josefina-giaccobe
josefina-giaccobe 🇻🇪

1 documento

1 / 24

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación Universitaria
Universidad Nacional Experimental Simón Rodríguez
Extensión Santa Cruz – Estado Aragua
Pruebas de hipótesis.
Facilitador: Participantes:
Pedro Ramírez Desireé Márquez
C.I: 29.786.258
Estadística II sección AL Mariangel López
C.I: 30.655.428
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18

Vista previa parcial del texto

¡Descarga Guía Práctica para Pruebas de Hipótesis en Estadística y más Guías, Proyectos, Investigaciones en PDF de Estadística solo en Docsity!

República Bolivariana de Venezuela Ministerio del Poder Popular para la Educación Universitaria Universidad Nacional Experimental Simón Rodríguez Extensión Santa Cruz – Estado Aragua

Pruebas de hipótesis.

Facilitador: Participantes: Pedro Ramírez Desireé Márquez C.I: 29.786. Estadística II sección AL Mariangel López C.I: 30.655.

(Espacio para introducción)

Hipótesis nula e hipótesis alternativa Si queremos decidir entre dos hipótesis que afectan a un cierto parámetro de la población, a partir de la información de la muestra usaremos el contraste de hipótesis, cuando optemos por una de estas dos hipótesis, hemos de conocer una medida del error cometido, es decir, cuantas veces de cada cien nos equivocamos. -Hipótesis nula , denotada como H 0 , establece que el parámetro bajo estudio tiene un valor establecido, o bien que la variable aleatoria sigue una determinada distribución. Por lo tanto, al expresar simbólicamente la hipótesis nula, siempre se utiliza el símbolo de la igualdad. -Hipótesis alternativa : llamada H 1 , afirma que el parámetro o la distribución son distintos a lo que asegura la hipótesis nula, de allí que, para expresar simbólicamente la hipótesis alternativa, se utilizan los símbolos: <, > o ≠, pero nunca la igualdad. Cuando se acepta la hipótesis nula, se rechaza la hipótesis alternativa, de manera que ambas son mutuamente excluyentes. Los contrastes de hipótesis pueden ser de dos tipos:  Bilateral: En la hipótesis alternativa aparece el signo distinto.  Unilateral: En la hipótesis alternativa aparece o el signo > o el signo <. Si se cumple una de las siguientes hipótesis :  El tamaño de la muestra es mayor de 30 y la variable sigue un modelo normal.  El tamaño de la muestra es mayor de 100. Estudiaremos el siguiente contrate de hipótesis bilateral : Calculamos los siguientes valores:  , valor experimental que se calcula a partir de la muestra.

 , valor teórico y es el valor que en la distribución N(0,1) deja a su derecha un área de alfa/2 para un nivel de significación alfa. Es el valor z que definíamos ala principio del tema. La regla de decisión fijado el nivel de significación, alfa, es la siguiente:  Si se acepta la hipótesis alternativa, llegamos a la conclusión de que la hipótesis es cierta.  Si se acepta la hipótesis nula, en realidad no podemos afirmar que sea cierta, sino que la hipótesis alternativa no es cierta, ya que el margen de error con el que se acepta la hipótesis nula es muy grande. Nivel de significancia Es una medida para el error que se puede cometer al realizar una prueba de hipótesis. Se define como la probabilidad de rechazar la hipótesis nula, siendo que es verdadera. Se denota usualmente con la letra griega α: α = P (rechazar H 0 cuando es verdadera) Los valores comúnmente usados para α son 0.01, 0.05, y 0.10; siendo el segundo el de uso más frecuente. Equivalen respectivamente a 1%, 5 % y 10% de probabilidad de equivocarse al rechazar H 0 , pero en todo caso, cuanto menor sea el nivel de significancia, más confiable el resultado de la prueba. El valor alfa (α), puede entenderse como la fracción porcentual de área de la cola derecha (o izquierda), en una distribución normal tipificada (μ=0 y σ =1) y estos valores ocurren siempre en z= 2,33 para α= 0.01; en z= 1,65 para α= 1,65 y en z= 1,29 para α= 0,1.

Y cuando n < 30, pero σ es desconocida, se usa la t de Student. Paso 5 Establecer criterios de aceptación o rechazo de la hipótesis nula, lo cual puede hacerse mediante dos procedimientos:  A través de los valores de P.  Por comparación con los valores críticos. Los valores de P equivalen a la probabilidad de obtener los resultados encontrados, dado que la hipótesis nula es verdadera. Si estos valores son pequeños, se rechaza la hipótesis nula, si no lo son, se acepta. En todo caso, los valores de P no constituyen la prueba de que la hipótesis alternativa sea verdadera. Se debe tener en cuenta que en una prueba de hipótesis es posible cometer dos tipos de error:  Error tipo I : rechazar H 0 cuando es verdadera. Su probabilidad es α y equivale al nivel de significancia de la prueba.  Error tipo II : aceptar H 0 cuando en realidad es falsa. Su probabilidad se denota como β. Paso 6 Tomar la decisión de aceptar o rechazar la hipótesis nula. Si se usan los valores de P, cuando P < α, se rechaza H 0 y se acepta H 1 , y en caso contrario, se acepta H 0. El conjunto de valores P < α se conoce como región crítica. Si el estadístico está en este intervalo se rechaza H 0. Análogamente, se selecciona un valor crítico, según el parámetro poblacional elegido. Si este es la media, se procede como sigue:  Prueba de una cola: θ < θ 0 o θ > θ 0  Prueba de dos colas: |θ| < θ 0

Ejemplo resuelto Una máquina fabrica tornillos cuyo valor nominal debe ser de 800 milímetros de largo, con una desviación estándar de 5%. Se toma una muestra aleatoria, es decir en distintos días de la semana de producción, que totaliza unos 40 tornillos. Cuando se calcula la longitud promedio de la muestra, se obtiene el valor 790 milímetros. Determinar si el largo promedio está en la tolerancia con niveles de significancia respectivamente de 1%, 5% y 10%. Solución Lo primero es calcular el estadístico de prueba del promedio, el cual en este caso es la desviación del promedio dividida entre el error estándar poblacional: Zc= (790 – 800) / (40/√40) = -1, Donde se ha tomado en cuenta que un 5% de desviación estándar corresponde a 40 de 800. La hipótesis nula es que el promedio de la muestra está dentro de la tolerancia permitida al nivel de significancia requerido, siempre que |Zc| sea menor que el valor tipificado |Zt|, de lo contrario se rechaza la hipótesis nula. Para significancias de 1% y 5% se cumple la hipótesis nula, ya que |Zc| < 2, y |Zc| < 1,65 respectivamente. Sin embargo, para significancia de 10% ocurre que |Zc| > 1,29. Es decir, que a este nivel de significancia no se cumple la hipótesis nula.

Prueba de un valor hipotético de la media utilizando distribución normal. La Prueba de Hipótesis para medias usando Distribución Normal se usa cuando se cumplen las siguientes dos condiciones:

  • Es posible calcular las media y la desviación estándar a partir de la muestra.
  • El tamaño de la muestra es mayor o igual a 30. El procedimiento obedece a los 5 pasos esenciales: Paso 1: Plantear Hipótesis Nula (H₀) e Hipótesis Alternativa (H₁). La hipótesis alternativa plantea matemáticamente lo que queremos demostrar. La hipótesis nula plantea exactamente lo contrario. Paso 2: Determinar nivel de significancia. (Rango de aceptación de hipótesis alternativa).
  • 0.05 para proyectos de investigación
  • 0.01 para aseguramiento de calidad
  • 0.10 para encuestas de mercadotecnia y políticas. Paso 3: Evidencia de la Muestra. Se calcula la media y la desviación estándar a partir de la muestra. Paso 4: Se aplica la Distribución Normal para calcular la probabilidad de error (P) por medio de la fórmula: Donde: Paso 5: Se buscan las regiones de aceptación o rechazo. Conclusión: Se acepta o rechaza la Hipótesis Nula y se concluye en base a la Hipótesis Alternativa.

Paso 3: Evidencia Muestral Paso 4: Aplicando la Distribución Normal Calculando Z*: Paso 5: Toma de Decisión Buscando en la Tabla los valores de Z para problemas de Una Cola:

Para un nivel de significancia de 0.05: Z= 1. Colocando en la campana el valor de Z encontrado y el valor de Z calculado en el paso 4 (Z=0.83): Se tiene una región de rechazo puesto que es un problema de una cola. El valor de Z = 0.83 se encuentra en la Región de NO Rechazo. Conclusión: Se acepta hipótesis nula Se rechaza hipótesis alternativa De acuerdo a la muestra, no existe suficiente evidencia para demostrar que los estudiantes consumen más de 18 tazas de café a la semana.

Ejemplo de uso Por ejemplo, supongamos que diseñamos un sistema que analiza si un correo electrónico puede considerarse que es basura, para filtrarlo automáticamente y enviarlo a una carpeta independiente. Para ello, nuestro sistema puede considerar varias características del mensaje, como conocer o no quién lo envía, si contiene muchos enlaces, etc. Debido a que el sistema está destinado a detectar correo basura, nuestra hipótesis nula es que el mensaje no es correo basura, es decir, no hay relación entre el mensaje y el hecho de ser considerado correo basura. Entonces:  Error de tipo I : un mensaje se considera correo basura cuando no lo es (falso positivo).  Error de tipo II : un mensaje de correo basura no se detecta como tal (falso negativo). En este caso, para ajustar nuestro sistema y medir su efectividad, será necesario ver cuántos errores cometemos de cada tipo, y determinar lo preferible que es tener más errores de un tipo que del otro. Así, un sistema que determina que todos los correos recibidos son basura, los detectaría todos, pero no sería útil, ya que habría un gran número de falsos positivos.

En este escenario es mucho más aceptable que ocasionalmente un mensaje de correo basura se esté colando en la bandeja de entrada en lugar de al revés, es decir, perder un mensaje legal al clasificarlo como correo basura, es decir, preferimos tener falsos negativos que falsos positivos. En un proceso de prueba de hipótesis, no es posible tener garantía absoluta de no estar cometiendo algún error. La siguiente tabla resume los escenarios posibles. Error de tipo 1: Si la hipótesis nula es en realidad verdadera, y se la rechaza, se comete el error de tipo 1. También se llama nivel se significación de la prueba. La probabilidad de cometerlo se representa cómo:

Prueba de un valor hipotético de la media utilizando F de Student. Método de valor P para probar hipótesis nula referente a la media poblacional. Al probar hipótesis en las que la estadística de prueba es discreta, la región crítica se puede elegir de forma arbitraria y determinar su tamaño. Si es demasiado grande, se puede reducir al hacer un ajuste en el valor crítico. Puede ser necesario aumentar el tamaño de la muestra para compensar la disminución que ocurre de manera automática en la potencia de la prueba (probabilidad de rechazar Ho dado que una alternativa específica es verdadera). Por generaciones enteras de análisis estadístico, se ha hecho costumbre elegir un nivel de significancia de 0.05 ó 0.01 y seleccionar la región crítica en consecuencia. Entonces, por supuesto, el rechazo o no rechazo estricto de Ho dependerá de esa región crítica. En la estadística aplicada los usuarios han adoptado de forma extensa la aproximación del valor P. La aproximación se diseña para dar al usuario una alternativa a la simple conclusión de "rechazo" o "no rechazo". La aproximación del valor P como ayuda en la toma de decisiones es bastante natural pues casi todos los paquetes de computadora que proporcionan el cálculo de prueba de hipótesis entregan valores de P junto con valores de la estadística de la prueba apropiada.  Un valor P es el nivel (de significancia) más bajo en el que el valor observado de la estadística de prueba es significativo.  El valor P es el nivel de significancia más pequeño que conduce al rechazo de la hipótesis nula Ho.  El valor P es el mínimo nivel de significancia en el cual Ho sería rechazada cuando se utiliza un procedimiento de prueba especificado con un conjunto dado de información. Una vez que el valor de P se haya determinado, la conclusión en cualquier nivel particular resulta de comparar el valor P con 

  1. Valor P rechazar Ho al nivel.
  2. Valor P > No rechazar Ho al nivel Ensayo Unilateral Derecho:

Ensayo Unilateral Izquierdo: Ensayo Bilateral: Ejemplo : Calcular el valor de P para el primer ejemplo de ensayo de hipótesis en donde se quería probar que la edad media de los habitantes de Estados Unidos es superior a 70 años. Solución :

1. Ensayo de hipótesis Ho; = 70 años. H 1 ; > 70 años.