









Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Tarea de medidas de tendencia central, dispersion y posicion en R
Tipo: Ejercicios
1 / 15
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
Escuela Superior Politécnica del Litoral Fecha: 13/06/2021 Materia: Estadística 1 Estudiantes: Tema: Deber # Ximena Madelyne Molina Fernandez Bryan Steven Mantuano Perero Juan Pablo Santana Torres Antecedente: El índice de masa corporal (IMC) es un número que se calcula con base en el peso y la estatura de la persona. Para la mayoría de las personas, el IMC es un indicador confiable de la gordura y se usa para identificar las categorías de peso que pueden llevar a problemas de salud. Sabemos que, con las condiciones actuales de la pandemia, existe un deterioro de las condiciones de salud de las personas, inclusive en jóvenes debido al actual sedentarismo. A partir del archivo de datos (Deber_1.xlsx) recopilado con las características de los diferentes paralelos de Estadística I, se pide: Cree una nueva variable categórica llamada "condición", la cual debe tomar los valores, ● Infrapeso (si el IMC < 17) ● Normal (si el 17 <= IMC < 25) ● Sobrepeso (si el 25 <= IMC < 30) ● Obeso (si el IMC >= 30) Recuerde que el ICM es una función del peso (kg) y la estatura (m).
1. Estadística descriptiva univariada datos=Deber_1_con head(datos) #En Excel se agregó la nueva variable "condición" #Construya tablas de frecuencias y diagramas de barras Cualitativas: Variable Sexo #1 Tabla de frecuencias (cualitativas) #Sexo table(datos) fa = table(Deber_1_con$Sexo) fa n=length(Deber_1_con$Sexo) fb=fa/n cbind(fa,fb) tabla = cbind('Frec. Abs.' = fa,'Frec. Rel.' = round(fb,3)) print(tabla) ● Tabla de frecuencias ● Diagrama de barras #Diagramas de barras #Sexo install.packages("ggplot2") library(ggplot2) ggplot(Deber_1_con,aes(x=Sexo)) + geom_bar() ggplot(data=Deber_1_con,aes(x=Sexo,y = ..prop.., group = 1)) + #añadimos nombres de ejes geom_bar() + xlab("Sexo") + ylab("frec. relativa")+ggtitle("Diagrama de barras")
ggplot(datos, aes(x = Condición)) + geom_bar(fill =color1) + #Diagrama de Barras Variable Condición ggtitle("Variable Cualitativa Condicion") + ylab("Estudiantes") + theme_classic() ● Comentario: Se realizó un análisis mediante tabla de frecuencias a la variable Condición para determinar el estado de salud de la muestra tomada y se obtuvieron los siguientes datos: o El 53.5% de los estudiantes se encuentra en su peso Normal o El 12.8% de los estudiantes se encuentra en Infrapeso o El 7% de los estudiantes se encuentra con Sobrepeso o El 26.7% de los estudiantes se encuentra en condición Obesa Cuantitativas Variable Peso #construya tablas de frecuencias, histogramas, diagramas de cajas y estadísticas descriptivas #tablas de frecuencias install.packages("descriptr") library(descriptr) ?ds_screener ds_screener(Deber_1_con) ds_freq_table(Deber_1_con,Peso (Lbr)
)
#Histogramas de frecuencias library(ggplot2) ggplot(data=Deber_1_con,aes(x=Peso (Lbr)
)) +geom_histogram(aes(y = stat(count)/sum(count)),bins = 10,fill = "green",color = "black") + theme_classic()+ggtitle("Histograma") ● Comentario: En el desarrollo de procesar los datos para obtener información, se evaluó la variable peso el cual indica que el promedio de cada estudiante de Estadística 1 es de 63 kilos, conociendo que el 80.24% pesa alrededor de 43 a 83 kilos. Por otro lado, un 9.88% se encuentra en condición de infrapeso y el 8.14% con obesidad.
Estadísticas descriptivas ⮚ Medidas de tendencia central #Medidas de tendencia central Media aritmética mean(datos$Peso (Lbr)
) Mediana median(datos$Peso (Lbr)
) ⮚ Medidas de posición #Medidas de posición Mínimo min(datos$Peso (Lbr)
) Máximo max(datos$Peso (Lbr)
) Cuantil quantile(datos$Peso (Lbr)
,probs = 0.25) quantile(datos$Peso (Lbr)
,probs = 0.50) quantile(datos$Peso (Lbr)
,probs = 0.10) quantile(datos$Peso (Lbr)
,probs = 0.95) ⮚ Medidas de dispersión
#Medidas de dispersión Desviación estándar sd(datos$Peso (Lbr)
) Varianza var(datos$Peso (Lbr)
) Covarianza cv=sd(datos$Peso (Lbr)
)/mean(datos$Peso (Lbr)
)* cv Comentario de las medidas: Luego de realizar el análisis de cada una de las medidas descriptivas, y resumiendo en una tabla , pudimos determinar los valores más relevantes de la muestra a razón del peso son:
● Comentario: Al realizar la tabla de frecuencias de la variable Estatura , podemos determinar la frecuencia relativa y en base a esto, crear un histograma. Podemos apreciar que los datos tienen una tendencia céntrica entre 162.6 y 170.4 cm. ● Diagrama de Cajas ggplot(data=Deber_1_con,aes(x=Estatura (cm)
)) + geom_boxplot() ● Comentario: En promedio de estatura entre ambos sexos, el 25% de estudiantes miden menos o igual a 1.62 (m) siendo el promedio de estatura de 1.68 (m), de igual manera se observa que un 75% miden menor o igual a 1.74 (m). Dentro del experimento no se encontró ningún estudiante que haya superado el máximo ni mínimo de los extremos de estatura dentro de Estadística 1.
Estadísticas descriptivas ⮚ Medidas de tendencia central Media aritmética mean(datos$Estatura (cm)
) Mediana median(datos$Estatura (cm)
) ⮚ Medidas de posición #Medidas de posicion Mínimo min(datos$Estatura (cm)
) Máximo max(datos$Estatura (cm)
) Cuantil quantile(datos$Estatura (cm)
,probs = 0.25) quantile(datos$Estatura (cm)
,probs = 0.50) quantile(datos$Estatura (cm)
,probs = 0.10) quantile(datos$Estatura (cm)
,probs = 0.95)
# Estadística descriptiva multivariada ------------------------------------
#matriz de diagramas de dispersión. ggplot(data=Deber_1_con,aes(x=Peso (Lbr)
, y=Estatura (cm)
)) + geom_point(aes(color = sexo))
● Comentario Como se observa en la gráfica existe una baja correlación positiva entre ambas variables analizadas, esto indica que a medida que aumenta la estatura, aumenta el peso del estudiante. Diagramas de cajas por sexo #Diagramas de cajas por sexo. ggplot(data=Deber_1_con,aes(x=Peso (Lbr)
)) + geom_boxplot(fill = "blue",color = "black") + ylim(-1,1) + xlab("Estatura (cm)
") + ggtitle("Diagrama de Cajas") + theme(axis.text.y=element_blank(),axis.ticks.y=element_blank()) ggplot(data=Deber_1_con,aes(x=Peso (Lbr)
,y=Estatura (cm)
,fill = Sexo)) + geom_boxplot(alpha = 0.4,color = "black") +ggtitle("Diagrama de Cajas") + theme(axis.text.y=element_blank(),axis.ticks.y=element_blank()) ● Comentario: Como se observa en el diagrama existen dos estudiantes mujeres que sobrepasan el máximo de estatura y peso dentro de su promedio, sin embargo, en su mayoría están dentro de la media. De igual forma se observa que los estudiantes hombres que en general tienen una media natural de ambas variables.