Introducción a R

Karen Velasquez-C

¿Qué es R?

En pocas palabras R es un lenguaje y un ambiente creado para realizar operaciones estadísticas y gráficas.

Historia de R

En un principio R se derivó de otro lenguaje, S. El lenguaje S fue un proyecto que inició en 1976 de la mano de John Chambers y que maduró hasta 1998.

La idea de S era generar una interfaz que facilitara el análisis de datos a los programadores, pero paulatinamente también a un público menos especializado.

En 1991 Ross Ihaka y Robert Gentleman se basaron en S, para crear R (Ihaka and Gentleman 1996). Lo crucial respecto a R es que fue creado como un software libre, es decir que además de ser gratuito, su código es abierto.

Código abierto !!

R en sí es joven ya que la primera versión se lanzó al público en el 2000 y ahora es manejado por el R core Team (R Core Team 2017).R en sí es joven ya que la primera versión se lanzó al público en el 2000 y ahora es manejado por el R core Team (R Core Team 2017).

¿Qué es RStudio? (Posit)

RStudio es un entorno de desarrollo integrado (IDE), una interfaz que ayuda a mejorar y potenciar varios aspectos de R (actualmente también de otros lenguajes)

Fue lanzado en el 2010, y en Octubre 2022 Rstudio fue adquirido por posit. Busca integrar lenguajes como phyton, java y julia a la misma interfaz.

https://education.rstudio.com/

Proyectos en RStudio

RStudio permite un esquema de trabajo en proyectos. Cuando trabajamos con R debemos especificar la ruta (dirección de la carpeta) donde estarán los archivos que usaremos. Si trabajamos fuera de proyectos, cada vez que iniciamos R debemos especificar la dirección.

Al crear proyectos con RStudio el IDE automáticamente selecciona la carpeta del proyecto como directorio de trabajo. Tiene otras ventajas, pero esta es la que más nos compete en este nivel.

  1. Abrir RStudio

  2. ir a archivo (file) -> nuevo proyecto (new Project)

  3. En una se crea una nueva carpeta y en la segunda se selecciona una carpeta previamente existente.

¿Porqué usar R?

Te estarás preguntando porque después de años de perfeccionar tus poderes en Excel, ahora tienes que aprender R. “Te puedo dar una razón”fea” y es que en este curso y en muchos de posgrado, ya es un requisito saber R.” Andrade-Ponce 2023

Beneficios usar R

  1. La reproducibilidad: Algo muy importante en la ciencia, pero que quizás no tenemos muy en cuenta. Al desarrollar un script con el análisis de tu artículo o tesis en R, tienes la capacidad de compartirlo. No solo para que alguien lo replique tal cual y sepa que esta bien o mal, sino también para que otras personas aprendan. De hecho, ahora muchosartículos vienen acompañados de sus respectivo código.
  1. Es como aprender un idioma: Ejercita tu cerebro y te ayuda a mejorar tu razonamiento cuantitativo. No lo digo yo, lo dice la ciencia (Auker and Barthelmess 2020).
  1. Es el futuro: Nos guste o no, las habilidades de programación son cada vez más requeridas y apreciadas (Lai et al. 2019). No solo en la academia, sino también en la industria, saber manejar, graficar y analizar datos puede ser una gran ventaja (Feng, Qiao, and Enquist 2020) . No digo que todos tengan que ser especialistas, pero si tener al menos nociones.
  1. Infinitas (casi) posibilidades: En la actualidad R no es solo para la estadística, puedes hacer muchísimas cosas. Desde documentos, infografias, hasta memes.

https://cran.r-project.org/web/packages/meme/vignettes/meme.html

Oportunidades con R

Manejo de datos

Procesar, transformar y explorar tus datos. Con R puedes transformar tus datos (no la transformación que están pensando pero si), siempre y cuando sepas cómo. Esto es importante porque ciertos análisis requieren una estructura de datos particular.

https://bookdown.org/content/3515/tidydata.html

Estadística

En parte es para lo que fue creado R, dado que tiene la capacidad de ajustar una buena variedad de modelos. Pero es la comunidad la que se ha encargado de agregar a R una gama bastante amplia de análisis. Puedes encontrar hoy en día modelos estadísticos para temas ecológicos, de bioinformatica, filogenia, biología molecular, morfometría etc.

https://lakens.github.io/statistical_inferences

Gráficas

La capacidad gráfica de R es grandiosa. Puedes hacer mapas, animaciones, arte etc. Aprender a graficar hace parte importante del proceso de explorar tus datos.

https://r-graph-gallery.com/index.html

https://r-charts.com/

Documentos

Con Rmakrwon y Quarto se pude generar documentos de html, pdf, word y pptx desde R. Hay paquetes diseñados para generar CV, presentaciones, libros, artículos científicos e incluso tesis.

https://yihui.org/en/2022/04/quarto-r-markdown/

Paginas web

Como nuestra pagina de curso :)

https://allisonhorst.com/allison-horst

Aplicaciones

Crear aplicaciones e interfaz de usuario para explorar datos o facilitar los procesos. Por ejemplo, si tienes dudas de las estadísticas de algunos pokémon, puedes checar esta app creada en R https://dgranjon.shinyapps.io/shinyMons/_w_74175819/

https://smirnovayu.shinyapps.io/hangman_en/

Comunidad

Al ser un lenguaje abierto, la comunidad aporta desde diversas fuentes.

Allison Horst code hero

Quizás lo mejor que tiene R y RStudio es su comunidad. Existen mucha información, tutoriales, guías, páginas de ayuda, foros y comunidades enfocadas en ayudar y enseñar.

Conferencias de R

Otro ejemplo muy importante es la comunidad de R, es el de Rladies Global y sus diferentes capitulos. R-laides busca promover la diversidad de género en la comunidad de R. Existe un capítulo de R-ladies en Xalapa y su misión es proporcionar un espacio comunitario seguro para cualquier persona que se identifique como género minoritario.

Recapitulando -> Aquí no aprenderán R

R cómo cualquier idioma se aprende practicando. En este curso te daremos las herramientas para comenzar, pero es normal que al final sientas que no sabes nada. No te frustres este es apenas el inicio.

Seguramente, cuando estés por tu cuenta regresaras a buscar scripts, para recordar como se graficaba o incluso la manera en que se cargan los datos. También te enfrentaras a muchos errores y es que R no se trata de no cometer errores, sino de cometer tantos que ya sabes como solucionarlos.

En conclusión, que aprendas R dependerá de cuanto tiempo le dediques, no de que tomes este tutorial o no (Lawlor et al. 2022).

Allison Horst rollercoaster

Referencias

Auker, Linda A., and Erika L. Barthelmess. 2020. “Teaching R in the Undergraduate Ecology Classroom: Approaches, Lessons Learned, and Recommendations.” Ecosphere 11 (4): e03060. https://doi.org/10.1002/ecs2.3060.
Feng, Xiao, Huijie Qiao, and Brian J Enquist. 2020. “Doubling Demands in Programming Skills Call for Ecoinformatics Education.” Frontiers in Ecology and the Environment 18 (3): 123–24. https://doi.org/10.1002/fee.2179.
Ihaka, Ross, and Robert Gentleman. 1996. “R: A Language for Data Analysis and Graphics.” Journal of Computational and Graphical Statistics 5 (3): 299–314. https://doi.org/10.2307/1390807.
Lai, Jiangshan, Christopher J. Lortie, Robert A. Muenchen, Jian Yang, and Keping Ma. 2019. “Evaluating the Popularity of R in Ecology.” Ecosphere 10 (1): e02567. https://doi.org/10.1002/ecs2.2567.
Lawlor, Jake, Francis Banville, Norma-Rocio Forero-Muñoz, Katherine Hébert, Juan Andrés Martínez-Lanfranco, Pierre Rogy, and A. Andrew M. MacDonald. 2022. “Ten Simple Rules for Teaching Yourself R.” PLOS Computational Biology 18 (9): e1010372. https://doi.org/10.1371/journal.pcbi.1010372.
R Core Team. 2017. R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing,. Vienna, Austria. http://www.R-project.org/.