Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Medidas de Dispersión en Estadística: Aplicaciones y Teorema de Chebyshev, Guías, Proyectos, Investigaciones de Estadística

Medidas de Dispersión en probabilidad y estadística para ingenieros

Tipo: Guías, Proyectos, Investigaciones

2019/2020

Subido el 28/05/2020

laura_mar.franco
laura_mar.franco 🇨🇴

2.7

(7)

14 documentos

1 / 6

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Marco Antonio Triana
Docente área de Estadística - UAO
1
UNIVERSIDAD AUTONOMA DE OCCIDENTE
FACULTAD DE CIENCIAS BASICAS
DEPARTAMENTO DE MATEMATICAS
AREA DE ESTADISTICA
PROBABILIDAD Y ESTADISTICA
MEDIDAS DE DISPERSION
En el tema anterior estudiamos algunas medidas de tendencia central, las cuales
permiten representar la magnitud de los datos en la muestra. De acuerdo al grado de
variabilidad de los datos en la muestra, podemos determinar si la media aritmética por
ejemplo es representativa para un conjunto de datos. Por esta razón, estudiaremos
algunas medidas de dispersión, con la intención de conocer que tan confiables son los
indicadores de centralidad.
Las medidas de dispersión ó medidas de variabilidad, muestran la variabilidad de una
distribución (comportamiento de un conjunto de datos) con un indicador que suele
representarse con un valor numérico. Por medio de este indicador se puede observar si
los diferentes valores de una variable están muy alejados de la media.
Si la distancia entre los diferentes valores de una variable y su media es grande,
mayor será la variabilidad de los datos, en caso contrario, podemos decir que los datos
son homogéneos. Así, se puede saber si todos los valores de una variable son parecidos
o varían mucho entre ellos.
Una de las aplicaciones más comunes de las medidas de dispersión se muestra en la
siguiente situación: Se tiene un grupo de hombres y otro grupo de mujeres. Se toma
información de las edades (años) respectivamente. Para el grupo de hombres se
obtuvieron los siguientes datos: 38, 42, 37, 43, 39, 41 y para el grupo de mujeres: 32,
48, 27, 53, 25, 55. Calculando la media aritmética se encuentra que la edad promedio
de los hombres y la edad promedio de las mujeres es igual a 40 años; más sin
embargo, se puede observar que el promedio en el grupo de hombres representa mejor
los datos que los del grupo de mujeres, puesto que los datos del grupo de hombres
están menos dispersos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se puede
utilizar la desviación estándar.
Entre las medidas de dispersión más importantes tenemos: Varianza, desviación
estándar y coeficiente de variación.
Problema 1. Los siguientes datos representan mediciones del tiempo (minutos)
utilizado para localizar y reparar sistemáticamente averías que se encuentran en una
muestra de equipos de electrónica industrial y de telecomunicaciones (por ejemplo,
receptores HF para uso con PC):
13.1, 14.8, 17.1, 19.0, 10.2, 18.0, 19.8, 15.0, 17.3, 10.8, 20.3, 14.5, 17.1, 14.9, 17.1
Actividades a desarrollar
Calcule la varianza de los datos.
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Medidas de Dispersión en Estadística: Aplicaciones y Teorema de Chebyshev y más Guías, Proyectos, Investigaciones en PDF de Estadística solo en Docsity!

Marco Antonio Triana

UNIVERSIDAD AUTONOMA DE OCCIDENTE

FACULTAD DE CIENCIAS BASICAS

DEPARTAMENTO DE MATEMATICAS

AREA DE ESTADISTICA

PROBABILIDAD Y ESTADISTICA

MEDIDAS DE DISPERSION

En el tema anterior estudiamos algunas medidas de tendencia central, las cuales permiten representar la magnitud de los datos en la muestra. De acuerdo al grado de variabilidad de los datos en la muestra, podemos determinar si la media aritmética por ejemplo es representativa para un conjunto de datos. Por esta razón, estudiaremos algunas medidas de dispersión, con la intención de conocer que tan confiables son los indicadores de centralidad.

Las medidas de dispersión ó medidas de variabilidad, muestran la variabilidad de una distribución (comportamiento de un conjunto de datos) con un indicador que suele representarse con un valor numérico. Por medio de este indicador se puede observar si los diferentes valores de una variable están muy alejados de la media.

Si la distancia entre los diferentes valores de una variable y su media es grande, mayor será la variabilidad de los datos, en caso contrario, podemos decir que los datos son homogéneos. Así, se puede saber si todos los valores de una variable son parecidos o varían mucho entre ellos.

Una de las aplicaciones más comunes de las medidas de dispersión se muestra en la siguiente situación: Se tiene un grupo de hombres y otro grupo de mujeres. Se toma información de las edades (años) respectivamente. Para el grupo de hombres se obtuvieron los siguientes datos: 38, 42, 37, 43, 39, 41 y para el grupo de mujeres: 32, 48, 27, 53, 25, 55. Calculando la media aritmética se encuentra que la edad promedio de los hombres y la edad promedio de las mujeres es igual a 40 años; más sin embargo, se puede observar que el promedio en el grupo de hombres representa mejor los datos que los del grupo de mujeres, puesto que los datos del grupo de hombres están menos dispersos.

Para calcular la variabilidad que una distribución tiene respecto de su media, se puede utilizar la desviación estándar.

Entre las medidas de dispersión más importantes tenemos: Varianza, desviación

estándar y coeficiente de variación.

Problema 1. Los siguientes datos representan mediciones del tiempo (minutos) utilizado para localizar y reparar sistemáticamente averías que se encuentran en una muestra de equipos de electrónica industrial y de telecomunicaciones (por ejemplo, receptores HF para uso con PC):

13.1, 14.8, 17.1, 19.0, 10.2, 18.0, 19.8, 15.0, 17.3, 10.8, 20.3, 14.5, 17.1, 14.9, 17.

Actividades a desarrollar

 Calcule la varianza de los datos.

Marco Antonio Triana

 Calcule la desviación estándar de los datos. Interprete claramente.

 Calcule el coeficiente de variación. Interprete su resultado.

 ¿Cuál es la aplicación del teorema de Chebyshev?

 Verifique el principio de Tchebycheff para k = 2.

 De acuerdo con el teorema de Chebyshev, construya un intervalo alrededor de la

media que contenga por lo menos el 60 % de los datos.

Actividad. Solución del problema 1

La varianza ( S^2 ). Esta es la medida de dispersión más usada en estadística y está definida como:

 

2

2 1

n i i

x x

S

n

 ( 1 )

 La varianza calcula el promedio de las desviaciones al cuadrado de las puntuaciones respecto a la media aritmética.

La varianza tiene algunas desventajas, entre las cuales podemos mencionar: su no fácil interpretación directa, debido a que sus unidades no coinciden con las unidades de la

variable xi en estudio, así por ejemplo si x está en metros, su varianza estará dada en

metros cuadrados. Esta última desventaja se pretende remediar extrayendo la raíz cuadrada a la varianza para obtener la que se conoce como desviación estándar ( S ), que será:

 

2 1 1

n i i

x x S n

 ( 2 )

Recordemos que la media aritmética es igual a 15,93. Aplicando la formula (1), tenemos que la varianza de los datos del problema 1 es igual a:

2 (^13 ,^115 ,^93 )^2 (^14 ,^815 ,^93 )^2 ............. (^17 ,^115 ,^93 )^2

S 

 La desviación estándar. S  9 , 021  3 , 00.

Significado de la desviación estándar. La dispersión entre el tiempo utilizado para localizar y reparar sistemáticamente averías de cada uno de los equipos de electrónica industrial con respecto a su media es de 3 minutos aproximadamente.

 El coeficiente de variación (c.v). De acuerdo a la formula de la varianza se puede observar que si el valor de S^2 aumenta, se sabe que aumenta la

Marco Antonio Triana

Es decir que en el intervalo construido a 2 desviaciones estándar a cada lado de la media se encuentra por lo menos el 75 % de los datos. Para k = 3 , se dice que está por lo menos el 88,8 % de los datos. Se observa que para k = 1 el principio dice que

en el intervalo ^ x^ ^ s , x ^ s ) se encuentra por los menos un dato , lo cual es

indiscutible.

 Verifiquemos el principio de Tchebycheff para k = 2

  2

h x  s x  s    

El intervalo correspondiente para k = 2 es el siguiente:

x  2 s  15 , 93  2 * 3 , 00  9 , 93

x  2 s  15 , 93  2 * 3 , 00  21 , 93

 Es decir se debe verificar que en el intervalo (^)  9 , 93 ; 21 , 93 se encuentra por lo menos el 75% de los datos.

 De acuerdo con los datos del problema 1 , podemos ver que todos los datos caen dentro del intervalo  9 , 93 ; 21 , 93 , es decir, se encuentra el 100%.

 En conclusión, vemos que se cumple el principio de Tchebycheff para k = 2.

 De acuerdo con el teorema de Chebyshev, construya un intervalo alrededor de la

media que contenga por lo menos el 60 % de los datos.

Aplicamos la formula (4) para encontrar un intervalo que contiene por lo menos el 60% de los datos:

  0 , 60

1 1

1  ,   1  2   2  k k

hx ks x ks al despejar k tenemos:

k 

Ahora, reemplazamos el valor de k en la formula (4) de la siguiente manera:

( x  1 , 58 s ) 15 , 93  1 , 58 * 3 , 00  11 , 19 ( x  1 , 58 s ) 15 , 93  1 , 58 * 3 , 00  20 , 67

Entonces, por lo menos el 60% de los equipos de electrónica industrial y de telecomunicaciones emplean entre 11,19 y 20,67 minutos para localizar y reparar sistemáticamente averías.

Problema 2. Los siguientes datos que aparecen en la tabla de frecuencias representan

mediciones del tiempo (minutos) utilizado para localizar y reparar sistemáticamente

averías que se encuentran en una muestra de equipos de electrónica industrial y de

telecomunicaciones (por ejemplo, receptores HF para uso con PC):

Marco Antonio Triana

TABLA DE FRECUENCIAS

Clase Intervalo de Clase

Marca de Frecuencia Frecuencia Frecuencia acumulada

Densidad de frecuenci a

No. i  LInf , L Sup  clase xi absoluta ni relativa hi absoluta

Ni

relativa Hi

h i

Total 50 100%

Actividades a desarrollar

 Calcule la varianza de los datos.

 Calcule la desviación estándar de los datos. Interprete claramente

 Calcule el coeficiente de variación.

 De acuerdo con el teorema de Chebyshev, construya un intervalo alrededor de la

media que contenga por lo menos el 65 % de los datos.

Actividad. Solución del problema 2

 Calcule la varianza de los datos.

Si se dispone de una distribución de frecuencias (variables continuas), se puede calcular como:

'^2 2 1 1

m i i i

n x x S n

Recordemos que la media aritmética para los datos agrupados de la tabla de frecuencias es:

X 

Aplicando la formula (5), tenemos que la varianza de los datos es igual a:

2 2 2

S 