Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

MANUAL RSTUDIO - 2020, Apuntes de Lenguajes de Programación

Rstudio manual de uso y programacion del programa

Tipo: Apuntes

2019/2020

Subido el 22/07/2023

billy-leon-2
billy-leon-2 🇵🇪

3 documentos

1 / 13

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
MANUAL DE RSTUDIO
HUARAZ - 2023
Manual
pf3
pf4
pf5
pf8
pf9
pfa
pfd

Vista previa parcial del texto

¡Descarga MANUAL RSTUDIO - 2020 y más Apuntes en PDF de Lenguajes de Programación solo en Docsity!

Manual

ÍNDICE

  • I. INTRODUCCIÓN
  • II. Importar datos desde Excel
    • 2.1 Instalar Paquete
    • 2.2 Generar la ruta de la base de datos
    • 2.3 Importar la Base de Datos
  • III. Organización de datos
    • 3.1 Tablas de frecuencias
    • 3.2 Tabla de contingencia con table
    • 3.3 Ejemplo: tabla de frecuencia de una vía
    • 3.4 Ejemplo: tabla de frecuencia de dos vías
  • IV. Desviación Estándar........................................................................
  • V. Representaciones gráficas
    • 5.1 Gráfico de sectores
  • VI. REGRESIÓN LINEAL.................................................................
    • 6.1 Recta de Regresión Lineal Simple
    • 6.2 Gráfica de la Recta de Regresión simple
    • 6.3 Regresión lineal múltiple

II. Importar datos desde Excel 2.1 Instalar Paquete Primero necesitamos instalar el paquete readxl. Seleccionamos la opción instalar del menú Packages, escribimos el nombre del paquete que queramos, le damos clic en instalar y esperamos o bien podemos escribir el siguiente código para descargarlo. #Importar una base de datos desde Excel #Instalamos el paquete readxl install.packages(“readxl”) Luego activamos la librería como vimos anteriormente, es necesario ejecutar cada función que necesitamos usar. #Cargamos la librería readxl library(readxl) 2.2 Generar la ruta de la base de datos Necesitamos la ruta o dirección del archivo donde se encuentra la base de datos que utilizaremos para los requerimientos de este manual. Solo basta ingresar el siguiente comando file.choose(). #Seleccionamos el archivo excel file.choose()

Al ejecutar se abrirá una ventana donde debes buscar el archivo en este caso Excel, donde se encuentran los datos para analizar. El documento Excel que utilizaremos se llama BASE DE DATOS. Luego de tener seleccionado el documento, presionamos Abrir La ruta resultará en el cuadrante inferior derecho. Debemos de copiar esa ruta para el siguiente paso (sin las comillas). Guardamos esta ruta en una variable que llamaremos bd_practica #Asignamos a una variable el nombre de la ruta bd_practica<-"C:\Users\LENOVO\Desktop\BASE DE DATOS.xlsx" NOTA: Esta dirección o ruta va a variar para cada usuario. 2.3 Importar la Base de Datos Ahora utilizamos la función que requería instalar el paquete readxl. Es decir, importaremos la base de datos al RStudio con el comando read_excel(nombre_ruta) y lo asignamos a otra variable. No olvidemos ir ejecutando cada línea de códigos. #Importar la base de datos llamada bd_practica base_datos<-read_excel(bd_practica)

Los parámetros de la función son:

  • ... espacio para ubicar los nombres de los objetos (variables o vectores) para los cuales se quiere construir la tabla.
  • exclude: vector con los niveles a remover de la tabla. Si exclude=NULL implica que se desean ver los NA, lo que equivale a useNA = 'always'.
  • useNA: instrucción de lo que se desea con los NA. Hay tres posibles valores para este parámetro: 'no' si no se desean usar, ' ifany ' y ' always ' si se desean incluir. 3.3 Ejemplo: tabla de frecuencia de una vía Considere el vector sexo de la base de datos base_datos y construya una tabla de frecuencias absolutas para el género. #Contruyendo una tabla de frecuencia de una vía sexo<-c(base_datos$Sexo) sexo tabla1<-table(sexo) tabla 3.4 Ejemplo: tabla de frecuencia de dos vías Consideremos otro vector llamado diabetes de la base de datos base_datos y construyamos una tabla de frecuencias absolutas para ver cómo se relaciona el sexo con la diabetes del ejemplo anterior.

#Contruyendo una tabla de frecuencia de doble vía diabetes<-c(base_datos$Diabetes) diabetes tabla2<-table(sexo,diabetes) tabla IV. Desviación Estándar Para hallar la desviación estándar se utiliza la función sd(variable) por ejemplo, hallaremos la desviación estándar de la variable Edad de la base de datos base_datos. #Desviación estándar desv_est<-sd(base_datos$Edad) desv_est De esta forma obtenemos la desviación estándar de la variable Edad, siendo un valor de 11.11237, se puede decir que tiene una dispersión moderada. Si deseas tener menos decimales, puede redondear a dos decimales utilizando la función round(variable, cant_dígitos) #Desviación estándar desv_est<-round(sd(base_datos$Edad),2) desv_est

#Agregamos los porcentajes labels<-c("Si","No") # añade las etiquetas porcentajes <- round(tabla3/sum(tabla3)*100) #calcula los porcentajes labels <- paste(labels, porcentajes) # añade los porcentajes labels <- paste(labels,"%",sep="") # añade los porcentajes a las etiquetas #Generamos el grafico de sectores con porcentajes pie(tabla3, label=labels, col = rainbow(length(tabla3)), main="Grafico de sectores sobre la depresión") VI. REGRESIÓN LINEAL 6.1 Recta de Regresión Lineal Simple Para poder generar la recta de regresión, el comando básico es lm (linear models). El primer argumento de este comando es una fórmula y ~ x en la que se especifica cuál es la variable respuesta o dependiente (y) y cuál es la variable regresora o independiente (x). El segundo argumento, llamado data especifica cuál es el fichero en el que se encuentran las variables. El resultado lo guardamos en un objeto llamado regresión. En este caso usaremos como variable independiente al Peso y como variable dependiente IMC de la base de datos base_datos

#Regresion lineal regresion<-lm(IMC ~ Peso, data = base_datos) regresion Lo que nos puede interesar de la regresión lineal, es determinar en qué grado la variable independiente explica a la variable dependiente. Si bien es cierto para poder aplicar una regresión lineal, las variables deben de cumplir algunos supuestos como la normalidad de los datos, pero ello será tema de investigación, por ahora calcularemos el coeficiente de determinación que nos servirá para ver en qué grado se ajusta esta línea de regresión a los datos reales. Con la función summary(nombre de la regresión) obtendremos los coeficientes de la recta para poder predecir valores y el coeficiente de determinación, para ver en qué grado la variable peso explica a la variable índice de masa corporal. #Determinar los coeficientes de la recta y R^ summary(regresion) Lo que nos interesa con mayor énfasis son los valores, en los círculos rojos, en la parte superior tenemos los coeficientes de la recta, para predecir valores futuros. Y el circulo en la parte inferior es el valor del coeficiente de determinación, podemos observar que tiene un valor muy bajo, por lo que esta variable Peso no es suficiente para explicar al índice de masa corporal (IMC)

#Aumentando una variable más a la regresion regresion 2 <-lm(IMC ~ Peso+Altura, data = base_datos) regresion 2 Esta nueva regresión la llamamos regresion2 , cómo observamos aumentamos la variable Altura , después de un signo +. De la misma manera para obtener los resultados que nos interesa utilizamos la función summary(). #Determinar los coeficientes de la recta y el R^ summary(regresion2) Podemos observar que el coeficiente de determinación ha aumentado de forma considerable y esto porque el índice de masa corporal está mejor explicado con las variables Peso y Altura.