Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

ejercicios resueltos de probabilidad y estadística, Ejercicios de Probabilidad y Procesos Estocásticos

ejercicios resueltos de probabilidad y estadística complejos

Tipo: Ejercicios

2019/2020
En oferta
30 Puntos
Discount

Oferta a tiempo limitado


Subido el 27/09/2020

rcs-oficial
rcs-oficial 🇲🇽

5

(2)

1 documento

1 / 65

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Ejercicios Resueltos de Estadística:
Tema 1: Descripciones univariantes
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
Discount

En oferta

Vista previa parcial del texto

¡Descarga ejercicios resueltos de probabilidad y estadística y más Ejercicios en PDF de Probabilidad y Procesos Estocásticos solo en Docsity!

Ejercicios Resueltos de Estadística:

Tema 1: Descripciones univariantes

1. Los datos que se dan a continuación corresponden a los pesos en Kg. de ochenta personas: (a) Obténgase una distribución de datos en intervalos de amplitud 5, siendo el primer intervalo [50; 55]. (b) Calcúlese el porcentaje de personas de peso menor que 65 Kg. (c) ¿Cuántas personas tienen peso mayor o igual que 70 Kg. pero menor que 85? 60; 66; 77; 70; 66; 68; 57; 70; 66; 52; 75; 65; 69; 71; 58; 66; 67; 74; 61; 6 3 ; 6 9 ; 8 0 ; 5 9 ; 6 6 ; 7 0 ; 6 7 ; 7 8 ; 7 5 ; 6 4 ; 7 1 ; 8 1 ; 6 2 ; 6 4 ; 6 9 ; 6 8 ; 7 2 ; 8 3 ; 5 6 ; 6 5 ; 7 4 ; 6 7 ; 5 4 ; 6 5 ; 6 5 ; 6 9 ; 6 1 ; 6 7 ; 7 3 ; 5 7 ; 6 2 ; 6 7 ; 6 8 ; 6 3 ; 6 7 ; 7 1 ; 6 8 ; 7 6 ; 6 1 ; 62; 63; 76; 61; 67; 67; 64; 72; 64; 73; 79; 58; 67; 71; 68; 59; 69; 70; 6 6 ; 62; 63; 66; SOLUCIÓN: (a) Como se trata de efectuar una distribución de datos agrupados, debemos obtener primero los intervalos correspondientes, situando los datos en sus lugares respectivos: Li-1 - Li (^) ni Ni [50;55) 2 2 [55; 60) 7 9 [60; 65) (^17 ) [65;70) 30 56 [70; 75) 14 70 [75; 80) 7 77 [80; 85] 3 80 80 (b) Observando la columna de frecuencias acumuladas se deduce que existen N 3 = 26 individuos cuyo peso es menor que 65 Kg., que en términos de porcentaje corresponden a:

(c) El número de individuos con peso comprendido entre 70 y 85 Kg. es: n 5 + n 6 + n 7 = 14 + 7 + 3 = 24 lo que es equivalente a: N 7 – N 4 = 80 – 56 = 24

Li-1 - Li (^) ni [18; 25) 22 [25; 35) 48 [35; 45) 51 [45; 55) 36 [55; 65] 27 184 A la vista de la tabla anterior, la distribución pedida es: Edad N.° de empleados Más de 18 184 Más de 25 162 Más de 35 114 Más de 45 63 Más de 55 27

4. Las temperaturas medias registradas durante el mes de mayo en Madrid, en grados centígrados, están dadas por la siguiente tabla: Temperatura 13 14 15 16 17 18 19 20 21 22 N.° de días 1 1 2 3 6 8 4 3 2 1 Constrúyase la representación gráfica correspondiente. SOLUCIÓN:

8 7 6 5 4 Dias 3 2 1 0 13 14 15 16 17 18 19 20 21 22

5. Dada la distribución de frecuencias: xi (^) ni 1 9 2 22 3 13 4 23 5 8 6 25 (a) Constrúyase una tabla en la que aparezcan frecuencias absolutas, frecuencias relativas, frecuencias acumuladas absolutas crecientes (o «menos de») y decrecientes (o «más de»). (b) Represéntese mediante un diagrama de barras la distribución dada y su correspondiente polígono de frecuencias. (c) Obténgase el polígono de frecuencias absolutas acumuladas crecientes y decrecientes. SOLUCIÓN: (a) La tabla pedida es la siguiente: xi ni fi Ni↓ Ni↑ 1 9 0,09 9 100 2 22 0,22 31 91 3 13 0,13 44 69 4 23 0,23 67 56 (b) 5 8 0,08 75 33 6 25 0,25 100 25 100 1

10-20 26 20-30 92 30-40 86 40-50 74 50-60 27 60-70 12 SOLUCIÓN: Como es una distribución de datos agrupados, o de tipo III, cuyos intervalos tienen amplitudes iguales (a = 10), su representación gráfica es el histograma siguiente, en el que se han colocado como alturas las frecuencias absolutas: 100 80 60 Frecuencias 40 Absolutas 20 0 10 20 30 40 50 60 70 0

7. Dada la siguiente distribución de frecuencias: Li-1-Li (^) ni 1-3 3 3-7 29 7-8 35 8-10 26 10-13 6 13-20 1 (a) Constrúyase una tabla en la que aparezcan las marcas de clase, las frecuencias absolutas y relativas y las frecuencias absolutas acumuladas crecientes (o «menos de») y decrecientes (o «más de»). (b) Represéntese la distribución mediante un histograma y su correspondiente polígono de frecuencias. SOLUCIÓN: (a) La tabla pedida es la siguiente, en la que se han añadido, además, la columna de las amplitudes de los intervalos y la columna de las alturas correspondientes para

construir el histograma. Li-1-Li (^) ni xi fi N (^) i ↓ N (^) i ↑ ai hi [1;3) 3 2 0,03 3 100 2 1, [3;7) 29 5 0,29 32 97 4 7, [7; 8) 35 7,5 0,35 67 68 1 35 [8; 1) 26 9 0,26 93 33 2 13 [10;13) 6 11,5 0,06 99 7 3 2 [13;20] 1 16,5 0,01 100 1 7 0, 100 1 (b) Con la primera y última columna de la tabla anterior se obtienen el siguiente histograma y su polígono de frecuencias: 35 30 25 20 15 h i 10 5 0 3 5 7 9 11 13 15 17 19 1 40 35 30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

8. Encuestados cincuenta matrimonios respecto a su número de hijos, se obtuvieron los siguientes datos: 2; 4; 2; 3; 1; 2; 4; 2; 3; 0; 2; 2; 2; 3; 2; 6; 2;3;2;2;3;2;3;3;4;1; 3; 3; 4; 5; 2; 0; 3; 2;1;2;3;2;2;3;1; 4; 2; 3; 2; 4; 3; 3; 2 Constrúyase una tabla estadística que represente dichos datos:

La Media Aritmética de las veinticinco familias encuestadas será: 5

a = ∑

x

i ⋅^ ni^0 ⋅^5 +^1 ⋅^6 +^2 ⋅^8 +^3 ⋅^4 +^4 ⋅^2
i − 1 = = = 1,
n 25 25

es decir, las familias encuestadas tienen un número medio de hijos de 1'68. El Recorrido será R = 4 - 0 = 4. La Varianza es: s^2 = 4'24 - (1'68)^2 = 1'4176. Y la Desviación Típica s = 1'85. Para este ejemplo el Coeficiente de Variación de Pearson , Vp, toma el valor:

vp =

1, 1,68 ⋅^100 =^ 70, En cuanto a la simetría, el Coeficiente de Variación de Pearson , Ap,es igual a:

Ap =

1, 1, − 2

Con lo que la distribución es ligeramente asimétrica a la izquierda.

10. Calculo de la media aritmética, la mediana y la moda. Se analizó el IVA que se aplica, en diversos países europeos, a la compra de obras de arte. Los resultados obtenidos fueron los siguientes: PAIS España 0, Italia 0, Bélgica 0, Holanda 0, Alemania 0, Portugal 0, Luxemburgo 0, Finlandia 0, SOLUCIÓN: Ahora realizamos las cuatro distribuciones de frecuencias:

Xi ni fi Ni Fi 0,06 3 0,375 3 0, 0,07 1 0,125 4 0, 0,16 1 0,125 5 0, 0,17 1 0,125 6 0, 0,20 1 0,125 7 0, 0,22 1 0,125 8 1


Total 8 1 Calculamos la media aritmética:

a =

∑ x

i ⋅^ ni

n 8

Ahora calculamos la mediana:

Me =

x

j − 1

+ x

j = 0,07 + 0,16 = 0,115.

Por último, el valor mas frecuente, correspondiente a la moda , es el valor:

x j = 0,06. Por tanto:
M d = 0,06.

11. Con los mismos datos del ejercicio anterior vamos a calcular los cuartiles: SOLUCIÓN: Como sabemos el segundo cuartil es igual a la mediana:

P 2 4 = M e = 0,115.

Para determinar los otros dos cuartiles p1/4 Y p3/4, debemos establecer primero las desigualdades:

N j − 1 < k

r

⋅ n < N j

Para los casos r/k = 1/4 y r/k = 3/4. Para el primer cuartil:

4 ⋅^8 =^2 <^3 = N^1

Es decir menor que la primera frecuencia absoluta acumulada, por tanto:

SOLUCIÓN:

A) Q 3 − Q 1 B)
RQ = = IQ IQ = Q
3 − Q 1
RQ = 15 = 87 − 72
2 = IQ = 15
= RQ =7,

14. Unos grandes almacenes disponen de un aparcamiento para sus clientes. Los siguientes datos que se refieren al número de horas que permanecen en el aparcamiento una serie de coches:

Se pide: A- Obtener la tabla de frecuencias para ese conjunto de datos. Interpretar la tabla. B- Obtener la tabla de frecuencias ascendente y descendente. C- Determinar e interpretar la tercera cuartilla y el centil del 42%. D- Calcular el tiempo medio de permanencia de los coches en el aparcamiento. Interpretar el resultado y los elementos que intervienen. SOLUCIÓN: A- El primer paso para construir la tabla de frecuencias es determinar el número de valores diferentes en observación, k, que en este caso es 7. A continuación podemos ver que esos 7 valores van desde el 1, x 1 , al 7 7 , y podemos determinar la frecuencia absoluta y relativa de cada uno de esos valores. Una vez calculadas las frecuencias resulta la siguiente tabla de frecuencias.

x 1 ( n º horas ) 1 2 3 4 5 6 7
ni ( n º coches ) 5 8 12 15 10 6 4
fi (% coches ) 8.33^ 13.33^20 25 16.67^10 6.

En esta tabla aparecen por filas el número de horas que permanecen los coches en el aparcamiento, el número de coches que han aparcado durante cada número de horas y la proporción de coches en % que han estado aparcados durante cada número de horas. Una de las columnas, por ejemplo la cuarta, nos dice que 15 coches, que representa el 25% de los coches analizados, han estado aparcados durante 4 horas en el aparcamiento. B- La tabla de frecuencias ascendente es

xi ( n º horas ) 1 2 3 4 5 6 7

i

∑ nj ( n º _ coches _ acumulados ) 5 13 25 40 50 56 60

j = 1 i

∑ f j ( proporción _ acumulada ) 8.33^ 21.67^ 41.67^ 66.67^ 83.33^ 93.33^100

j = 1 La tabla de frecuencias descendente es:

xi ( n º horas ) 1 2 3 4 5 6 7

7

∑ nj ( n º coches _ acumulados ) 60 55 47 35 20 10 4

j = i 7

∑ f j ( proprción _ acumulada ) 100 91.67^ 78.34^ 58.34^ 33.34^ 16.67^ 6.

j = i C- La tercera cuartilla es el centil 75%, luego el ser N = 60 calculamos 0.75*60=45 que al ser entereo, la fórmula aplicada será c

= (^) x (45)

  • (^) x (46)
= 5 + 5 = 5 horas

Su significado es que el 75% de los coches analizados estacionan en el aparcamiento a lo sumo, o como máximo, 5 horas. Para calcular el centil 42% hallamos 0.42*60=25.2, que al no ser entero, deberemos utilizar la otra fórmula. c

= x ([25.2]+1) = x (26) = (^4) horas Su significado es que el 42% de los coches analizados estacionan en el aparcamiento a lo sumo, o como máximo, 4 horas. D- Según la primera fórmula, el tiempo medio de permanencia de los coches en el aparcamiento es k

___ ∑ n * x 231

i i

X = i =^1 = = 3.85 horas
N 60

f- Analizar la asimetría y el apuntamiento de la distribución de frecuencias resultante. g- Si el fabricante quiere proponer un kilometraje para realizar el cambio de neumáticos, ¿qué valor propondría para que solo 3 de cada 10 coches hayan tenido un pinchazo o reventón antes de ese kilometraje? SOLUCIÓN: a- La fórmula de Sturgess propone como número k de intervalos, para agrupar un conjunto de N observaciones en intervalos. k=1+ [3.3*log N] En este caso N=100, luego k=7. ahora debemos propones el límite inferior del primer intervalo y el límite superior del último intervalo. Al ser el valor mínimo 4.3068 se propone 4 como límite inferior del primer intervalo, y al ser 7 intervalos se propone como anchura 13 para cada uno de ellos, para que sea un valor entero, con lo cual el límite superior del último intervalo es 95. La tabla de frecuencias será:

Intervalo _ Ii^4 <^ x^ ≤^17 17 <^ x^ ≤^30 30 <^ x^ ≤^43
Frecuencia 2 2 19
absoluta _ ni
Frecuencia .02 .02.
relativa _ fi
Ii^43 <^ x^ ≤^56 56 <^ x^ ≤^69 69 <^ x^ ≤^82 82 <^ x^ ≤^95
ni^27 29 14
fi .27^ .29^ .14^.

En esta tabla aparecen por filas los intervalos, junto con la frecuncia absoluta y la frecuencia relativa. Por ejemplo la cuarta columna se puede interpretar diciendo que el 27% de estos neumáticos han recorrido entre 43000 y 5600 Km hasta que se ha producido un pinchazo o reventón. b- La tabla de frecuencias acumuladas ascendente sería:

Intervalos _ Ii (4,17]^ (17,30]^ (30,43]^ (43,56]^ (56,69]^ (]69,82^ (82,95]

i

n

j^2 4 23 50 79 93

j = 1 y la tabla de frecuencias acumuladas descendente quedaría

Intervalos _ Ii (4,17]^ (17,30]^ (30,43]^ (43,56]^ (56,69]^ (69,82]^ (82,985]

k

n

j^100 98 96 77 50 21

j = 1

c- El histograma de frecuencias relativas se represena es la figura 1 y el de frecuencias acumuladas en la figura 2. Frecuencias relativas

Frecuencia

17 _ _ 3 _ _ 5 _ 6 _ _ (^417 043 56 69 ) 3

Intervalo

Figura 1

Frecuencias relativas acumuladas

acumuladas 1, 1 0, 0, frecuencias 0, 0, 0 17 0 43 56 69 82 95 _ _ 3 _ _ _ _ _ (^4 17 0 43 56 69 ) 3 Intervalo Figura 2 d- Para calcular las medidas de tendencia central trabajamos con la tabla de frecuencias del apartado a. resulta que la media aritmética es


X = 55870 Km

Se interpreta diciendo que son los 100 neumáticos analizados se han recorrido 5587000 de Km antes de un pinchazo o reventón.

g 2 = m s^4 4

Esto significa que la distribución es de tupo platicúrtica, algo menos apuntada que la distribución normal de media 55870 km y desviación típica 16899 km. Por


tanto, en los intervalos X ± ks con k∈ Ν habrá menos proporción de

observaciones que en dicha distribución normal. g- Propondría un kilometraje tal que el 70% de los neumáticos no hayan pinchado o reventado antes de este kilometraje. Por tanto, buscamos el centil del 30%, que vendrá dado por c (^) 0.3 = 43 +13* (^27) 7

Luego el fabricante propondría cambiar los neumáticos a los 46370 km.

16. La tabla siguiente nos proporciona los valores de la media y la desviación típica de dos variables así como su coeficiente de correlación lineal para dos muestras diferentes: __ __

Muestra n º de _ observaciones x y sx^ sy^ rxy

Se pide: a- Recta de regresión de Y sobre X en cada muestra. b- Si consideramos la muestra que resulta de agrupar las dos muestras en una sola de tamaño 1000, obtener el nuevo coeficiente de correlación lineal de Pearson y explicar el hecho de que sea inferior a los de cada una de las muestras tomadas por separado. SOLUCIÓN: a- La recta de regresión de Y sobre X en cada muestra es

__ m ___
y = y +

11

( x − X )
sx

2 Como la información dada es la del coeficiente de correlación lineal,

r =

m 11

xy sx sy

se tiene que la recta de regresión es

___ s ___

y = Y + ry^ ( xX ) xy

sx

Luego, sustituyendo, las rectas de regresión de Y sobre X en cada una de las dos muestras son: Muestra 1: y=12+0.9(x-4) Muestra 2: y=10+0.93(x-7) b- Se trata de calcular el coeficiente de correlación lineal de Pearson en la nueva muestra de tamaño 1000, que notaremos por r y que será r = m 11, T xy , t

sx , T sy , T

donde m11, T es la covarianza en la muestra total y s (^) x , T , s (^) x , T las desviaciones típicas de X e Y en la muestra total. Para obtener estas cantidades necesitamos


X T e Y T , medias de X e Y en la muestra total, que se calculas como un

__

promedio entre las medias de X e Y en las muestras 1 y 2, notadas por X 1 ,

X 2 , Y 2 , según las relaciones siguientes
X T = X 1 *600 + X 2 *400___^ ___

Y T ___^ ___

= Y 1 *600 + Y 2 *


___ ___ = 11..
Sustituyendo se obtiene que X T = 5.8 e Y T

Por otra parte si m11, h denota la covarianza en la muestra h, se tiene que m11,1 =230.6=3. m11,2 =340.7=8. Como


m 1, h^ = ∑ nij , h xi , h y (^) j , h

− X Y

N h h h


Y , 1 resulta que: xy , t