Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Análisis de regresión en datos de géiser y osos, Ejercicios de Gestión de Costes

Varios ejercicios de análisis de regresión lineal simple y múltiple aplicados a diferentes conjuntos de datos. Se estudia la relación entre la duración de la erupción del géiser old faithful y el intervalo de tiempo posterior, el tamaño del pecho y el peso de osos, y la estatura y el pulso de mujeres. Además, se realiza un análisis de regresión múltiple para predecir el intervalo posterior a la erupción del géiser y el peso de los osos. Finalmente, se ajustan diferentes modelos de regresión para explicar la longitud de una especie de pez en función de su peso. Este documento podría ser útil para estudiantes de ingeniería, estadística o ciencias ambientales.

Tipo: Ejercicios

2021/2022

Subido el 30/11/2022

omar-piero-montoya-araujo
omar-piero-montoya-araujo 🇵🇪

4 documentos

1 / 3

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Ingeniería ambiental
ESTADISTICA II
Practica de laboratorio sobre regresión
…………………………………………………………………………………………………………………
…………………………..............................
Pregunta 1. El géiser Old Faithful es la atracción más visitada del Parque Nacional Yellowstone.
Está ubicado cerca del hotel Old Faithful Inn, que tal vez sea la segunda atracción más visitada de
Yellowstone. Los turistas disfrutan la comida, las bebidas, el alojamiento y las tiendas del hotel,
pero quieren asegurarse de ver al menos una erupción del famoso géiser Old Faithful. Los
guardabosques del parque ayudan a los turistas publicando el momento de la siguiente erupción.
¿Cómo hacen esas predicciones?
Cuando el Old Faithful hace erupción, se registran las siguientes mediciones: duración (en
segundos) de la erupción, el intervalo de tiempo (en minutos) entre la erupción anterior y la
erupción actual, el intervalo de tiempo (en minutos) entre la erupción actual y la siguiente, y la
altura (en pies) de la erupción. (Las mediciones se encuentran en la base de datos 23 - Old
Faithful).
Una vez que ocurre una erupción, queremos predecir el momento de la siguiente erupción que es
el “intervalo de tiempo posterior” a la erupción.
a) Construya un diagrama de dispersión entre la variable independiente “DURACIÓN” y la
variable dependiente “INTERVALO POSTERIOR”. ¿Cuáles son sus conclusiones?
b) Encuentre el coeficiente de correlación entre la variables DURACIÓN e INTERVALO
POSTERIOR. ¿Existe relación lineal significativa entre esas variables? Haga una prueba con un
nivel de significancia del 5%.
c) Realice un análisis de regresión entre la “DURACIÓN” y el “INTERVALO POSTERIOR”.
a. Escriba la ecuación de mínimos cuadrados que ayuda a predecir el INTERVALO
POSTERIOR a partir de la DURACIÓN de la erupción.
b. Interprete el coeficiente de regresión estimado.
c. Interprete el coeficiente de determinación estimado.
d. Si una erupción empezó a las 07:00 am y terminó a las 07:04 am. Estime la hora que se
producirá la siguiente erupción. Indique un intervalo de confianza para este pronóstico.
e. Según la prueba T para el coeficiente
β
, con un nivel de significancia del 5%, ¿podemos
concluir que
β 0
? Explique.
f. ¿Se cumplen los supuestos de la regresión lineal simple? Explique.
g. Encuentre un intervalo de confianza para el coeficiente
β
en el modelo de regresión lineal entre
y=INTERVALO POSTERIOR
Y
x=DURACIÓN
.
Pregunta 2. Remítase a la base de datos 09 - Bear Measurements (disponible en el aula virtual)
donde se presentan medidas del tamaño del pecho “CHEST” (en pulgadas) y el peso “WEIGHT”
(en libras) de osos elegidos al azar, que fueron anesteciados y medidos. Como es mucho más
difícil pesar un oso que medir el tamaño de su pecho, la presencia de una correlación podría
conducir a un método para estimar el peso a partir del tamaño de pecho.
pf3

Vista previa parcial del texto

¡Descarga Análisis de regresión en datos de géiser y osos y más Ejercicios en PDF de Gestión de Costes solo en Docsity!

ESTADISTICA II

Practica de laboratorio sobre regresión

…………………………………………………………………………………………………………………

…………………………..............................

Pregunta 1. El géiser Old Faithful es la atracción más visitada del Parque Nacional Yellowstone.

Está ubicado cerca del hotel Old Faithful Inn, que tal vez sea la segunda atracción más visitada de

Yellowstone. Los turistas disfrutan la comida, las bebidas, el alojamiento y las tiendas del hotel,

pero quieren asegurarse de ver al menos una erupción del famoso géiser Old Faithful. Los

guardabosques del parque ayudan a los turistas publicando el momento de la siguiente erupción.

¿Cómo hacen esas predicciones?

Cuando el Old Faithful hace erupción, se registran las siguientes mediciones: duración (en

segundos) de la erupción, el intervalo de tiempo (en minutos) entre la erupción anterior y la

erupción actual, el intervalo de tiempo (en minutos) entre la erupción actual y la siguiente, y la

altura (en pies) de la erupción. (Las mediciones se encuentran en la base de datos 23 - Old

Faithful).

Una vez que ocurre una erupción, queremos predecir el momento de la siguiente erupción que es

el “intervalo de tiempo posterior” a la erupción.

a) Construya un diagrama de dispersión entre la variable independiente “DURACIÓN” y la

variable dependiente “INTERVALO POSTERIOR”. ¿Cuáles son sus conclusiones?

b) Encuentre el coeficiente de correlación entre la variables DURACIÓN e INTERVALO

POSTERIOR. ¿Existe relación lineal significativa entre esas variables? Haga una prueba con un

nivel de significancia del 5%.

c) Realice un análisis de regresión entre la “DURACIÓN” y el “INTERVALO POSTERIOR”.

a. Escriba la ecuación de mínimos cuadrados que ayuda a predecir el INTERVALO

POSTERIOR a partir de la DURACIÓN de la erupción.

b. Interprete el coeficiente de regresión estimado.

c. Interprete el coeficiente de determinación estimado.

d. Si una erupción empezó a las 07:00 am y terminó a las 07:04 am. Estime la hora que se

producirá la siguiente erupción. Indique un intervalo de confianza para este pronóstico.

e. Según la prueba T para el coeficiente β , con un nivel de significancia del 5%, ¿podemos

concluir que

β ≠ 0 ? Explique.

f. ¿Se cumplen los supuestos de la regresión lineal simple? Explique.

g. Encuentre un intervalo de confianza para el coeficiente β en el modelo de regresión lineal entre

y = INTERVALO POSTERIOR Y x = DURACIÓN.

Pregunta 2. Remítase a la base de datos 09 - Bear Measurements (disponible en el aula virtual)

donde se presentan medidas del tamaño del pecho “CHEST” (en pulgadas) y el peso “WEIGHT”

(en libras) de osos elegidos al azar, que fueron anesteciados y medidos. Como es mucho más

difícil pesar un oso que medir el tamaño de su pecho, la presencia de una correlación podría

conducir a un método para estimar el peso a partir del tamaño de pecho.

a) ¿Existe correlación lineal positiva entre el tamaño del pecho y el peso de un oso? Haga una

prueba T para ρ usando un nivel de significancia del 5%.

b) Escriba la ecuación de la recta de mínimos cuadrados e interprete la pendiente.

c) Encuentre un intervalo de confianza para el peso promedio de un oso cuyo pecho mide 50

pulgadas.

d) Calcule e interprete el coeficiente de determinación.

e) ¿Existe relación lineal significativa entre el tamaño del pecho y el peso del oso? Haga una

prueba T para el coeficiente β con un nivel de significancia del 5%.

f) ¿Se cumplen los supuestos de regresión lineal simple? Explique.

Pregunta 3. Un estudiante de medicina hipotetiza que las personas más altas tienen pulsos más

rápidos porque la sangre tiene que viajar más lejos. Use la base de datos 01 - Body Data

(disponible en el aula virtual), en particular el pulso (en latidos por minuto) y la estatura (en cm).

Considerando solo las mujeres, ¿Parecería que la hipótesis del estudiante de medicina es

correcta?

Pregunta 4. El géiser Old Faithful es la atracción más visitada del Parque Nacional Yellowstone.

Está ubicado cerca del hotel Old Faithful Inn, que tal vez sea la segunda atracción más visitada de

Yellowstone. Los turistas disfrutan la comida, las bebidas, el alojamiento y las tiendas del hotel,

pero quieren asegurarse de ver al menos una erupción del famoso géiser Old Faithful. Los

guardabosques del parque ayudan a los turistas publicando el momento de la siguiente erupción.

¿Cómo hacen esas predicciones?

Cuando el Old Faithful hace erupción, se registran las siguientes mediciones: duración (en

segundos) de la erupción, el intervalo de tiempo (en minutos) entre la erupción anterior y la

erupción actual, el intervalo de tiempo (en minutos) entre la erupción actual y la siguiente, y la

altura (en pies) de la erupción. (Las mediciones se encuentran en la base de datos 23 - Old

Faithful).

Una vez que ocurre una erupción, queremos predecir el momento de la siguiente erupción que es

el “intervalo de tiempo posterior” a la erupción.

a) Construya una matriz de correlación para las variables DURACION, ALTURA, INTERVALO

ANTERIOR, INTERVALO POSTERIOR. Indique entre qué variables hay una relación lineal

significativa.

b) Encuentre la ecuación de mínimos cuadrados que ayuda a predecir el INTERVALO POSTERIOR

a partir de la DURACION, ALTURA, INTERVALO ANTERIOR. Interprete los coeficientes del

modelo de regresión muestral.

c) ¿Es útil el modelo de regresión múltiple para predecir el INTERVALO POSTERIOR a partir de la

DURACIÓN, ALTURA, INTERVALO ANTERIOR? Haga una prueba ANOVA para los coeficientes

del modelo.

d) ¿Alguna de las variables no contribuye significativamente a la regresión lineal múltiple? Si es así,

elimínela y obtenga un mejor modelo.

e) Suponiendo que entre la erupción anterior y la actual erupción hay una diferencia de 90

minutos, y que la actual erupción duró desde las 7:00 hasta las 7:04 a.m y alcanzó una altura

de 120 pies, ¿a qué hora se predice la siguiente erupción?

f) ¿Se cumplen los supuestos de regresión lineal múltiple? Explique.