Introducción a R y RStudio

Roger M. López

Introducción

En esta primera clase, vamos a introducirnos en el lenguaje de programación R, su instalación, el uso del entorno RStudio, y los primeros conceptos de objetos y operaciones.

¿Qué es R?

R es un lenguaje de programación utilizado principalmente para análisis de datos y estadísticas. Es de código abierto y cuenta con una comunidad muy activa.

“R nació como una reimplementación de software libre del lenguaje S, adicionado con soporte para ámbito estático. Se trata de uno de los lenguajes de programación más utilizados en investigación científica, siendo además muy popular en los campos de aprendizaje automático (machine learning), minería de datos, econometría, investigación biomédica, bioinformática y en el campo económico-financiero. A esto contribuye la posibilidad de cargar diferentes bibliotecas o paquetes con funcionalidades de cálculo y graficación. […] Fue desarrollado inicialmente por Robert Gentleman y Ross Ihaka del Departamento de Estadística de la Universidad de Auckland en 1993.”

Aún cuando existen alternativas quizás más sencillas de aprender para realizar análisis de datos como pueden ser Stata, SPSS, EViews o incluso MS Excel, R permite la automatización y reproducción de las rutinas más comunes, además de que provee un ecosistema completo para la publicación de los resultados en función a las distintas audiencias que uno pueda tener: otros analistas, presentaciones ejecutivas, conferencias…

Comparativa rápida

Aunque R no es uno de los lenguajes de programación más utilizados, sí es uno de los lenguajes más populares, ampliamente utilizado en el ámbito académico y profesional para análisis estadístico y visualización de datos.

Para el análisis de datos, sin embargo, los tres lenguajes más comunes son R, Python y Julia. Cada uno tiene sus ventajas y desventajas, dependiendo del contexto y las necesidades del usuario.

Lenguaje Pros Contras
R Paquetes estadísticos, comunidad Menor rendimiento en grandes datos
Python Versatilidad, bibliotecas robustas Menos enfoque estadístico
Julia Alto rendimiento, sintaxis clara Comunidad pequeña

Instalación

En esta sección, vamos a ver cómo instalar, primero, R y, en segundo lugar, RStudio, dos herramientas esenciales para trabajar con el lenguaje de programación R. Como recordatorio, R es el lenguaje de programación en sí, mientras que RStudio es un entorno de desarrollo integrado (IDE) que facilita el trabajo con R.

Paso a paso: descarga

En primer lugar, se debe descargar R. Para esto ingresamos a la página oficial, ya sea buscando en google o directamente en r-project.org

Paso a paso: OS

Aunque automáticamente suele detectar el sistema operativo, es recomendable verificar que se descargue la versión correcta.

Paso a paso: instalación y uso

Una vez instalado, se puede abrir R desde el menú de aplicaciones. Al abrirlo, se mostrará una consola donde se pueden escribir comandos directamente.

Instalación de RStudio

Para facilitar el uso de R, se recomienda instalar RStudio, un entorno de desarrollo integrado (IDE) que proporciona una interfaz más amigable y herramientas útiles para trabajar con R.

Paso a paso: instalación

Una vez instalado R, vamos a proceder a instalar rstudio.com.

Paso a paso: descargar

Existen diferentes versiones de RStudio, pero para este curso vamos a utilizar la versión gratuita, que se puede descargar desde la página oficial.