Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Tarea 1 primer parcial estadistica en R, Ejercicios de Estadística

Tarea de medidas de tendencia central, dispersion y posicion en R

Tipo: Ejercicios

2020/2021

Subido el 06/07/2021

ximena-molina-12
ximena-molina-12 🇪🇨

2 documentos

1 / 15

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Escuela Superior Politécnica del Litoral
Fecha: 13/06/2021 Materia: Estadística 1
Estudiantes: Tema: Deber #1
Ximena Madelyne Molina Fernandez
Bryan Steven Mantuano Perero
Juan Pablo Santana Torres
Antecedente:
El índice de masa corporal (IMC) es un número que se calcula con base en el peso y la estatura de
la persona. Para la mayoría de las personas, el.IMC.es un indicador confiable de la gordura y se usa
para identificar las categorías de peso que pueden llevar a problemas de salud.
Sabemos que, con las condiciones actuales de la pandemia, existe un deterioro de las condiciones de
salud de las personas, inclusive en jóvenes debido al actual sedentarismo.
A partir del archivo de datos (Deber_1.xlsx).recopilado con las características de los diferentes
paralelos de Estadística I, se pide:
Cree una nueva variable categórica llamada "condición", la cual debe tomar los valores,
Infrapeso. .(si el IMC < 17)
Normal. . . (si el 17 <= IMC < 25)
Sobrepeso (si el 25 <= IMC < 30)
Obeso. . . . (si el IMC >= 30)
Recuerde que el ICM es una función del peso (kg) y la estatura (m).
1. (20 Puntos) Estadística descriptiva univariada:
oPara las variables cualitativas: construya tablas de frecuencias y diagramas de barras
oPara las variables cuantitativas: construya tablas de frecuencias, histogramas, diagramas de
cajas y estadísticas descriptivas (medidas de tendencia central, posición y dispersión)
2. (20 Puntos) Estadística descriptiva multivariada:
oPara todos los pares de variables cuantitativas, grafique una matriz de diagramas de
dispersión.
oEn un solo gráfico, grafique los diagramas de cajas por sexo.
oDetermine la matriz de correlación.
3. (40 Puntos) Análisis Estadístico:.comente los principales hallazgos obtenidos. (Realice al
menos un comentario por cada gráfico o medida determinada)
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga Tarea 1 primer parcial estadistica en R y más Ejercicios en PDF de Estadística solo en Docsity!

Escuela Superior Politécnica del Litoral Fecha: 13/06/2021 Materia: Estadística 1 Estudiantes: Tema: Deber # Ximena Madelyne Molina Fernandez Bryan Steven Mantuano Perero Juan Pablo Santana Torres Antecedente: El índice de masa corporal (IMC) es un número que se calcula con base en el peso y la estatura de la persona. Para la mayoría de las personas, el IMC es un indicador confiable de la gordura y se usa para identificar las categorías de peso que pueden llevar a problemas de salud. Sabemos que, con las condiciones actuales de la pandemia, existe un deterioro de las condiciones de salud de las personas, inclusive en jóvenes debido al actual sedentarismo. A partir del archivo de datos (Deber_1.xlsx) recopilado con las características de los diferentes paralelos de Estadística I, se pide: Cree una nueva variable categórica llamada "condición", la cual debe tomar los valores, ● Infrapeso (si el IMC < 17) ● Normal (si el 17 <= IMC < 25) ● Sobrepeso (si el 25 <= IMC < 30) ● Obeso (si el IMC >= 30) Recuerde que el ICM es una función del peso (kg) y la estatura (m).

  1. (20 Puntos) Estadística descriptiva univariada: o Para las variables cualitativas: construya tablas de frecuencias y diagramas de barras o Para las variables cuantitativas: construya tablas de frecuencias, histogramas, diagramas de cajas y estadísticas descriptivas (medidas de tendencia central, posición y dispersión)
  2. (20 Puntos) Estadística descriptiva multivariada: o Para todos los pares de variables cuantitativas, grafique una matriz de diagramas de dispersión. o En un solo gráfico, grafique los diagramas de cajas por sexo. o Determine la matriz de correlación.
  3. (40 Puntos) Análisis Estadístico: comente los principales hallazgos obtenidos. (Realice al menos un comentario por cada gráfico o medida determinada)

1. Estadística descriptiva univariada datos=Deber_1_con head(datos) #En Excel se agregó la nueva variable "condición" #Construya tablas de frecuencias y diagramas de barras Cualitativas: Variable Sexo #1 Tabla de frecuencias (cualitativas) #Sexo table(datos) fa = table(Deber_1_con$Sexo) fa n=length(Deber_1_con$Sexo) fb=fa/n cbind(fa,fb) tabla = cbind('Frec. Abs.' = fa,'Frec. Rel.' = round(fb,3)) print(tabla)Tabla de frecuencias ● Diagrama de barras #Diagramas de barras #Sexo install.packages("ggplot2") library(ggplot2) ggplot(Deber_1_con,aes(x=Sexo)) + geom_bar() ggplot(data=Deber_1_con,aes(x=Sexo,y = ..prop.., group = 1)) + #añadimos nombres de ejes geom_bar() + xlab("Sexo") + ylab("frec. relativa")+ggtitle("Diagrama de barras")

ggplot(datos, aes(x = Condición)) + geom_bar(fill =color1) + #Diagrama de Barras Variable Condición ggtitle("Variable Cualitativa Condicion") + ylab("Estudiantes") + theme_classic() ● Comentario: Se realizó un análisis mediante tabla de frecuencias a la variable Condición para determinar el estado de salud de la muestra tomada y se obtuvieron los siguientes datos: o El 53.5% de los estudiantes se encuentra en su peso Normal o El 12.8% de los estudiantes se encuentra en Infrapeso o El 7% de los estudiantes se encuentra con Sobrepeso o El 26.7% de los estudiantes se encuentra en condición Obesa Cuantitativas Variable Peso #construya tablas de frecuencias, histogramas, diagramas de cajas y estadísticas descriptivas #tablas de frecuencias install.packages("descriptr") library(descriptr) ?ds_screener ds_screener(Deber_1_con) ds_freq_table(Deber_1_con,Peso (Lbr))

● Tabla de Frecuencia

● Histograma

#Histogramas de frecuencias library(ggplot2) ggplot(data=Deber_1_con,aes(x=Peso (Lbr))) +geom_histogram(aes(y = stat(count)/sum(count)),bins = 10,fill = "green",color = "black") + theme_classic()+ggtitle("Histograma") ● Comentario: En el desarrollo de procesar los datos para obtener información, se evaluó la variable peso el cual indica que el promedio de cada estudiante de Estadística 1 es de 63 kilos, conociendo que el 80.24% pesa alrededor de 43 a 83 kilos. Por otro lado, un 9.88% se encuentra en condición de infrapeso y el 8.14% con obesidad.

Estadísticas descriptivasMedidas de tendencia central #Medidas de tendencia central Media aritmética mean(datos$Peso (Lbr)) Mediana median(datos$Peso (Lbr))Medidas de posición #Medidas de posición Mínimo min(datos$Peso (Lbr)) Máximo max(datos$Peso (Lbr)) Cuantil quantile(datos$Peso (Lbr),probs = 0.25) quantile(datos$Peso (Lbr),probs = 0.50) quantile(datos$Peso (Lbr),probs = 0.10) quantile(datos$Peso (Lbr),probs = 0.95)Medidas de dispersión

#Medidas de dispersión Desviación estándar sd(datos$Peso (Lbr)) Varianza var(datos$Peso (Lbr)) Covarianza cv=sd(datos$Peso (Lbr))/mean(datos$Peso (Lbr))* cv Comentario de las medidas: Luego de realizar el análisis de cada una de las medidas descriptivas, y resumiendo en una tabla , pudimos determinar los valores más relevantes de la muestra a razón del peso son:

● Comentario: Al realizar la tabla de frecuencias de la variable Estatura , podemos determinar la frecuencia relativa y en base a esto, crear un histograma. Podemos apreciar que los datos tienen una tendencia céntrica entre 162.6 y 170.4 cm. ● Diagrama de Cajas ggplot(data=Deber_1_con,aes(x=Estatura (cm))) + geom_boxplot() ● Comentario: En promedio de estatura entre ambos sexos, el 25% de estudiantes miden menos o igual a 1.62 (m) siendo el promedio de estatura de 1.68 (m), de igual manera se observa que un 75% miden menor o igual a 1.74 (m). Dentro del experimento no se encontró ningún estudiante que haya superado el máximo ni mínimo de los extremos de estatura dentro de Estadística 1.

Estadísticas descriptivasMedidas de tendencia central Media aritmética mean(datos$Estatura (cm)) Mediana median(datos$Estatura (cm))Medidas de posición #Medidas de posicion Mínimo min(datos$Estatura (cm)) Máximo max(datos$Estatura (cm)) Cuantil quantile(datos$Estatura (cm),probs = 0.25) quantile(datos$Estatura (cm),probs = 0.50) quantile(datos$Estatura (cm),probs = 0.10) quantile(datos$Estatura (cm),probs = 0.95)

Estadística descriptiva multivariada

# Estadística descriptiva multivariada ------------------------------------

Diagrama de dispersión

#matriz de diagramas de dispersión. ggplot(data=Deber_1_con,aes(x=Peso (Lbr), y=Estatura (cm))) + geom_point(aes(color = sexo))

● Comentario Como se observa en la gráfica existe una baja correlación positiva entre ambas variables analizadas, esto indica que a medida que aumenta la estatura, aumenta el peso del estudiante. Diagramas de cajas por sexo #Diagramas de cajas por sexo. ggplot(data=Deber_1_con,aes(x=Peso (Lbr))) + geom_boxplot(fill = "blue",color = "black") + ylim(-1,1) + xlab("Estatura (cm)") + ggtitle("Diagrama de Cajas") + theme(axis.text.y=element_blank(),axis.ticks.y=element_blank()) ggplot(data=Deber_1_con,aes(x=Peso (Lbr),y=Estatura (cm),fill = Sexo)) + geom_boxplot(alpha = 0.4,color = "black") +ggtitle("Diagrama de Cajas") + theme(axis.text.y=element_blank(),axis.ticks.y=element_blank()) ● Comentario: Como se observa en el diagrama existen dos estudiantes mujeres que sobrepasan el máximo de estatura y peso dentro de su promedio, sin embargo, en su mayoría están dentro de la media. De igual forma se observa que los estudiantes hombres que en general tienen una media natural de ambas variables.