Clase 5: Análisis exploratorio de datos
Cristobal Alcazar 24 Oct 201824/10/18 a las 09:30 hrs.2018-10-24 09:30:24
Alumnos/as:
En la clase 5 realizamos un breve caso de análisis exploratorio sobre los datos del Titanic.
La idea de este tipo de análisis es levantar preguntas de interés acerca de nuestros datos.
Es importante enfocarse en la calidad de las preguntas, este planteamiento inicial nos guiara para usar las herramientas que hemos aprendido de los paquetes ggplot2 y dplyr para buscar respuestas o generar nuevas interrogantes.
Recuerden los siguientes puntos:
- Para visualizar la variación de una variable categórica, utilizamos gráficos de barra.
- Para visualizar la variación de una variable continua, utilizamos el gráfico conocido como histograma.
- Para visualizar la covariación entre una variable continua y una categórica, utilizamos el gráfico conocido como gráfico de caja y bigotes (boxplot).
- Para visualizar la covariación entre dos variables continuas, utilizamos el gráfico de dispersión (puntos).
- Para visualizar la covaración entre dos variables categóricas, utilizamos un gráfico de conteo (geom_count) que ve la cantidad de observaciones por cada grupo creado entre la intersección de ambas variables.
- Para visualizar la covariación entre dos variables categóricas, podemos utilizar además un gráfico de calor (geom_tile), donde la intesidad del color nos da información acerca de la cantidad de observaciones por grupo.
- Podemos utilizar la herramienta para visualizar distintas facetas de ggplot2 en conjunto con los gráficos anteriores: facet_wrap( ~ variable_categorica)
Pueden encontrar los apuntes de esta clase en el siguiente link:
rpubs.com/alcazar90/short_eda
Les recomiendo que vean el siguiente vídeo, es un análisis exploratorio en vivo realizado por el director de ciencias de datos de Datacamp:
Puede que muchas cosas no las entiendan, pero me interesa que vean el flujo de trabajo y como utiliza algunas de las herramientas que hemos visto.
El capítulo del texto guía es: r4ds.had.co.nz/ ... y-data-analysis.html
Saludos,
¡Cualquier duda comenten!
En la clase 5 realizamos un breve caso de análisis exploratorio sobre los datos del Titanic.
La idea de este tipo de análisis es levantar preguntas de interés acerca de nuestros datos.
Es importante enfocarse en la calidad de las preguntas, este planteamiento inicial nos guiara para usar las herramientas que hemos aprendido de los paquetes ggplot2 y dplyr para buscar respuestas o generar nuevas interrogantes.
Recuerden los siguientes puntos:
- Para visualizar la variación de una variable categórica, utilizamos gráficos de barra.
- Para visualizar la variación de una variable continua, utilizamos el gráfico conocido como histograma.
- Para visualizar la covariación entre una variable continua y una categórica, utilizamos el gráfico conocido como gráfico de caja y bigotes (boxplot).
- Para visualizar la covariación entre dos variables continuas, utilizamos el gráfico de dispersión (puntos).
- Para visualizar la covaración entre dos variables categóricas, utilizamos un gráfico de conteo (geom_count) que ve la cantidad de observaciones por cada grupo creado entre la intersección de ambas variables.
- Para visualizar la covariación entre dos variables categóricas, podemos utilizar además un gráfico de calor (geom_tile), donde la intesidad del color nos da información acerca de la cantidad de observaciones por grupo.
- Podemos utilizar la herramienta para visualizar distintas facetas de ggplot2 en conjunto con los gráficos anteriores: facet_wrap( ~ variable_categorica)
Pueden encontrar los apuntes de esta clase en el siguiente link:
rpubs.com/alcazar90/short_eda
Les recomiendo que vean el siguiente vídeo, es un análisis exploratorio en vivo realizado por el director de ciencias de datos de Datacamp:
Puede que muchas cosas no las entiendan, pero me interesa que vean el flujo de trabajo y como utiliza algunas de las herramientas que hemos visto.
El capítulo del texto guía es: r4ds.had.co.nz/ ... y-data-analysis.html
Saludos,
¡Cualquier duda comenten!
Última Modificación | 24 Oct 201824/10/18 a las 10:05 hrs.2018-10-24 10:05:24 |
---|---|
Vistas Únicas | 0 |
Compartir | |
Comentarios |
|