Clase 4: Los verbos de la manipulación.

Cristobal Alcazar 22 Oct 201822/10/18 a las 11:18 hrs.2018-10-22 11:18:22

¡Alumnos/as!

En nuestra clase número 4 vimos en mayor profundidad el paquete "dplyr".
Esta es nuestra aplicación (paquete extensión de R) para la etapa de "transformación" en nuestra tubería de datos.

Nos referimos a las principales funciones como verbos de la manipulación, esto porque ejecutan acciones que manipulan dataframes o data rectangular. Y específicamente vimos los siguientes verbos:

- filter: para filtrar observaciones
- select: para seleccionar variables por su nombre
- mutate: para crear nuevas variables
- summarise: para resumir valores
- arrange: para ordenar observaciones

Por motivos de tiempo no alcanzamos a ver la función "group_by", la cual cambia el dominio de acción de los verbos dentro de nuestra data rectangular, es decir, podemos crear grupos en base a variables y ejecutar los verbos a nivel de grupos.
Pueden encontrar más detalles de group_by y el resto de los verbos en los apuntes de la clase, rpubs.com/alcazar90/verbos_manipulacion



Vimos también el uso del operador pipe "%>%", cuyas teclas rápidas son ctrl + shift + m, para componer operaciones complejas utilizando los verbos en conjunto. Recuerden el ejemplo de Pin Pon al final de los apuntes, en todo caso, el operador pipe funciona así:
data_izquierda_primer_argumento %>% accion_derecha(otro_argumento) | ---- equivalente a ----> accion_derecha(data_izquierda_primer_argumento, otro_argumento)

La ventaja del operador es que nos permite descomponer un problema a nivel granular de verbos, es decir, que función de dplyr me sirve para resolver cada uno de los pasos. Luego, el operador combina la ejecución de los verbos de manera tal que mejora la lectura y composición del código, guiándonos en la resolución del problema. Recordemos que siempre el primer argumento en los verbos de la manipulación es una data rectangular y también que siempre el resultado será una data rectangular "transformada" por la acción ejecutada.

Finalmente recordar lo que vimos al principio de la clase 4, dedicamos un tiempo a ver que herramientas de edición disponen los R notebooks, pueden encontrar más información en el capítulo 27 del texto guía: r4ds.had.co.nz/r-markdown.html

PD: En material docente adjunte dos torpedos elaborados por personas de la comunidad de R hispanohablante resumiendo las funciones de los paquetes ggplot2 y dplyr.

Saludos,
¡cualquier duda comenten!
Compartir
Última Modificación 22 Oct 201822/10/18 a las 13:30 hrs.2018-10-22 13:30:22
Vistas Únicas 0
Comentarios