



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Medidas de Dispersión en probabilidad y estadística para ingenieros
Tipo: Guías, Proyectos, Investigaciones
1 / 6
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
Marco Antonio Triana
En el tema anterior estudiamos algunas medidas de tendencia central, las cuales permiten representar la magnitud de los datos en la muestra. De acuerdo al grado de variabilidad de los datos en la muestra, podemos determinar si la media aritmética por ejemplo es representativa para un conjunto de datos. Por esta razón, estudiaremos algunas medidas de dispersión, con la intención de conocer que tan confiables son los indicadores de centralidad.
Las medidas de dispersión ó medidas de variabilidad, muestran la variabilidad de una distribución (comportamiento de un conjunto de datos) con un indicador que suele representarse con un valor numérico. Por medio de este indicador se puede observar si los diferentes valores de una variable están muy alejados de la media.
Si la distancia entre los diferentes valores de una variable y su media es grande, mayor será la variabilidad de los datos, en caso contrario, podemos decir que los datos son homogéneos. Así, se puede saber si todos los valores de una variable son parecidos o varían mucho entre ellos.
Una de las aplicaciones más comunes de las medidas de dispersión se muestra en la siguiente situación: Se tiene un grupo de hombres y otro grupo de mujeres. Se toma información de las edades (años) respectivamente. Para el grupo de hombres se obtuvieron los siguientes datos: 38, 42, 37, 43, 39, 41 y para el grupo de mujeres: 32, 48, 27, 53, 25, 55. Calculando la media aritmética se encuentra que la edad promedio de los hombres y la edad promedio de las mujeres es igual a 40 años; más sin embargo, se puede observar que el promedio en el grupo de hombres representa mejor los datos que los del grupo de mujeres, puesto que los datos del grupo de hombres están menos dispersos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se puede utilizar la desviación estándar.
Entre las medidas de dispersión más importantes tenemos: Varianza, desviación
estándar y coeficiente de variación.
Problema 1. Los siguientes datos representan mediciones del tiempo (minutos) utilizado para localizar y reparar sistemáticamente averías que se encuentran en una muestra de equipos de electrónica industrial y de telecomunicaciones (por ejemplo, receptores HF para uso con PC):
13.1, 14.8, 17.1, 19.0, 10.2, 18.0, 19.8, 15.0, 17.3, 10.8, 20.3, 14.5, 17.1, 14.9, 17.
Actividades a desarrollar
Calcule la varianza de los datos.
Marco Antonio Triana
Calcule la desviación estándar de los datos. Interprete claramente.
Calcule el coeficiente de variación. Interprete su resultado.
¿Cuál es la aplicación del teorema de Chebyshev?
Verifique el principio de Tchebycheff para k = 2.
De acuerdo con el teorema de Chebyshev, construya un intervalo alrededor de la
media que contenga por lo menos el 60 % de los datos.
Actividad. Solución del problema 1
La varianza ( S^2 ). Esta es la medida de dispersión más usada en estadística y está definida como:
2
2 1
n i i
( 1 )
La varianza calcula el promedio de las desviaciones al cuadrado de las puntuaciones respecto a la media aritmética.
La varianza tiene algunas desventajas, entre las cuales podemos mencionar: su no fácil interpretación directa, debido a que sus unidades no coinciden con las unidades de la
variable xi en estudio, así por ejemplo si x está en metros, su varianza estará dada en
metros cuadrados. Esta última desventaja se pretende remediar extrayendo la raíz cuadrada a la varianza para obtener la que se conoce como desviación estándar ( S ), que será:
2 1 1
n i i
x x S n
( 2 )
Recordemos que la media aritmética es igual a 15,93. Aplicando la formula (1), tenemos que la varianza de los datos del problema 1 es igual a:
Significado de la desviación estándar. La dispersión entre el tiempo utilizado para localizar y reparar sistemáticamente averías de cada uno de los equipos de electrónica industrial con respecto a su media es de 3 minutos aproximadamente.
El coeficiente de variación (c.v). De acuerdo a la formula de la varianza se puede observar que si el valor de S^2 aumenta, se sabe que aumenta la
Marco Antonio Triana
Es decir que en el intervalo construido a 2 desviaciones estándar a cada lado de la media se encuentra por lo menos el 75 % de los datos. Para k = 3 , se dice que está por lo menos el 88,8 % de los datos. Se observa que para k = 1 el principio dice que
en el intervalo ^ x^ ^ s , x ^ s ) se encuentra por los menos un dato , lo cual es
indiscutible.
Verifiquemos el principio de Tchebycheff para k = 2
2
El intervalo correspondiente para k = 2 es el siguiente:
Es decir se debe verificar que en el intervalo (^) 9 , 93 ; 21 , 93 se encuentra por lo menos el 75% de los datos.
De acuerdo con los datos del problema 1 , podemos ver que todos los datos caen dentro del intervalo 9 , 93 ; 21 , 93 , es decir, se encuentra el 100%.
En conclusión, vemos que se cumple el principio de Tchebycheff para k = 2.
De acuerdo con el teorema de Chebyshev, construya un intervalo alrededor de la
media que contenga por lo menos el 60 % de los datos.
Aplicamos la formula (4) para encontrar un intervalo que contiene por lo menos el 60% de los datos:
0 , 60
1 1
1 , 1 2 2 k k
hx ks x ks al despejar k tenemos:
Ahora, reemplazamos el valor de k en la formula (4) de la siguiente manera:
Entonces, por lo menos el 60% de los equipos de electrónica industrial y de telecomunicaciones emplean entre 11,19 y 20,67 minutos para localizar y reparar sistemáticamente averías.
Problema 2. Los siguientes datos que aparecen en la tabla de frecuencias representan
mediciones del tiempo (minutos) utilizado para localizar y reparar sistemáticamente
averías que se encuentran en una muestra de equipos de electrónica industrial y de
telecomunicaciones (por ejemplo, receptores HF para uso con PC):
Marco Antonio Triana
Clase Intervalo de Clase
Marca de Frecuencia Frecuencia Frecuencia acumulada
Densidad de frecuenci a
Ni
relativa Hi
h i
Total 50 100%
Actividades a desarrollar
Calcule la varianza de los datos.
Calcule la desviación estándar de los datos. Interprete claramente
Calcule el coeficiente de variación.
De acuerdo con el teorema de Chebyshev, construya un intervalo alrededor de la
media que contenga por lo menos el 65 % de los datos.
Actividad. Solución del problema 2
Calcule la varianza de los datos.
Si se dispone de una distribución de frecuencias (variables continuas), se puede calcular como:
'^2 2 1 1
m i i i
n x x S n
Recordemos que la media aritmética para los datos agrupados de la tabla de frecuencias es:
Aplicando la formula (5), tenemos que la varianza de los datos es igual a:
2 2 2