







Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Rstudio manual de uso y programacion del programa
Tipo: Apuntes
1 / 13
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
II. Importar datos desde Excel 2.1 Instalar Paquete Primero necesitamos instalar el paquete readxl. Seleccionamos la opción instalar del menú Packages, escribimos el nombre del paquete que queramos, le damos clic en instalar y esperamos o bien podemos escribir el siguiente código para descargarlo. #Importar una base de datos desde Excel #Instalamos el paquete readxl install.packages(“readxl”) Luego activamos la librería como vimos anteriormente, es necesario ejecutar cada función que necesitamos usar. #Cargamos la librería readxl library(readxl) 2.2 Generar la ruta de la base de datos Necesitamos la ruta o dirección del archivo donde se encuentra la base de datos que utilizaremos para los requerimientos de este manual. Solo basta ingresar el siguiente comando file.choose(). #Seleccionamos el archivo excel file.choose()
Al ejecutar se abrirá una ventana donde debes buscar el archivo en este caso Excel, donde se encuentran los datos para analizar. El documento Excel que utilizaremos se llama BASE DE DATOS. Luego de tener seleccionado el documento, presionamos Abrir La ruta resultará en el cuadrante inferior derecho. Debemos de copiar esa ruta para el siguiente paso (sin las comillas). Guardamos esta ruta en una variable que llamaremos bd_practica #Asignamos a una variable el nombre de la ruta bd_practica<-"C:\Users\LENOVO\Desktop\BASE DE DATOS.xlsx" NOTA: Esta dirección o ruta va a variar para cada usuario. 2.3 Importar la Base de Datos Ahora utilizamos la función que requería instalar el paquete readxl. Es decir, importaremos la base de datos al RStudio con el comando read_excel(nombre_ruta) y lo asignamos a otra variable. No olvidemos ir ejecutando cada línea de códigos. #Importar la base de datos llamada bd_practica base_datos<-read_excel(bd_practica)
Los parámetros de la función son:
#Contruyendo una tabla de frecuencia de doble vía diabetes<-c(base_datos$Diabetes) diabetes tabla2<-table(sexo,diabetes) tabla IV. Desviación Estándar Para hallar la desviación estándar se utiliza la función sd(variable) por ejemplo, hallaremos la desviación estándar de la variable Edad de la base de datos base_datos. #Desviación estándar desv_est<-sd(base_datos$Edad) desv_est De esta forma obtenemos la desviación estándar de la variable Edad, siendo un valor de 11.11237, se puede decir que tiene una dispersión moderada. Si deseas tener menos decimales, puede redondear a dos decimales utilizando la función round(variable, cant_dígitos) #Desviación estándar desv_est<-round(sd(base_datos$Edad),2) desv_est
#Agregamos los porcentajes labels<-c("Si","No") # añade las etiquetas porcentajes <- round(tabla3/sum(tabla3)*100) #calcula los porcentajes labels <- paste(labels, porcentajes) # añade los porcentajes labels <- paste(labels,"%",sep="") # añade los porcentajes a las etiquetas #Generamos el grafico de sectores con porcentajes pie(tabla3, label=labels, col = rainbow(length(tabla3)), main="Grafico de sectores sobre la depresión") VI. REGRESIÓN LINEAL 6.1 Recta de Regresión Lineal Simple Para poder generar la recta de regresión, el comando básico es lm (linear models). El primer argumento de este comando es una fórmula y ~ x en la que se especifica cuál es la variable respuesta o dependiente (y) y cuál es la variable regresora o independiente (x). El segundo argumento, llamado data especifica cuál es el fichero en el que se encuentran las variables. El resultado lo guardamos en un objeto llamado regresión. En este caso usaremos como variable independiente al Peso y como variable dependiente IMC de la base de datos base_datos
#Regresion lineal regresion<-lm(IMC ~ Peso, data = base_datos) regresion Lo que nos puede interesar de la regresión lineal, es determinar en qué grado la variable independiente explica a la variable dependiente. Si bien es cierto para poder aplicar una regresión lineal, las variables deben de cumplir algunos supuestos como la normalidad de los datos, pero ello será tema de investigación, por ahora calcularemos el coeficiente de determinación que nos servirá para ver en qué grado se ajusta esta línea de regresión a los datos reales. Con la función summary(nombre de la regresión) obtendremos los coeficientes de la recta para poder predecir valores y el coeficiente de determinación, para ver en qué grado la variable peso explica a la variable índice de masa corporal. #Determinar los coeficientes de la recta y R^ summary(regresion) Lo que nos interesa con mayor énfasis son los valores, en los círculos rojos, en la parte superior tenemos los coeficientes de la recta, para predecir valores futuros. Y el circulo en la parte inferior es el valor del coeficiente de determinación, podemos observar que tiene un valor muy bajo, por lo que esta variable Peso no es suficiente para explicar al índice de masa corporal (IMC)
#Aumentando una variable más a la regresion regresion 2 <-lm(IMC ~ Peso+Altura, data = base_datos) regresion 2 Esta nueva regresión la llamamos regresion2 , cómo observamos aumentamos la variable Altura , después de un signo +. De la misma manera para obtener los resultados que nos interesa utilizamos la función summary(). #Determinar los coeficientes de la recta y el R^ summary(regresion2) Podemos observar que el coeficiente de determinación ha aumentado de forma considerable y esto porque el índice de masa corporal está mejor explicado con las variables Peso y Altura.