Exploratory Data Analysis

El Análisis Exploratorio de Datos (por sus siglas EDA en inglés) se encarga de explicar y visualizar con gráficas todo lo posible acerca de los datos. Es casi obligatoria realizar este EDA en cualquier proyecto de análisis de datos. En este capítulo veremos cuáles son las técnicas y herramientas más comunes para realizar nuestras visualizacionbes en Python.

Librerías

Matplotlib es un paquete para la generación de gráficos. Es la librería más usada, pero necesita muchas líneas de código para generar gráficos más complejos
Seaborn es un paquete para Python que permite generar fácilmente elegantes gráficos estadísticos. Seaborn está basada en Matplotlib y proporciona una interfaz de alto nivel que es realmente sencilla de aprender.
Altair es un paquete de Python para la visualización de datos basado en Vega y Vega-Lite, que a su vez están basados en D3. Altair utiliza lo que se conoce como “grammar of graphics”, donde se pone énfasis es en describir la apariencia visual y el comportamiento interactivo de la visualización.
Plotly es una librería para gráficos interactivos. Es particularmente útil para cuando queremos hacer gráficos en 3 dimensiones. Plotly está disponible como una biblioteca para Python, R, JavaScript, Julia y MATLAB.
Una librería que nos permite realizar un EDA completo de nuestro dataframe con tan solo un par de lineas de código.
Otra librería al igual que Pandas Profiling que nos permite realizar un EDA con pocas líneas.

Otros

📊 Gráficas

Ver Python Graph Gallery y From Data to Viz

Distribution

Histogram Density plot Box plot Violin plot
df.plot.hist()
sns.distplot()
df.plot.kde()
sns.kdeplot()
df.plot.box()
sns.boxplot()
sns.violinplot()

Correlation

Scatterplot Heatmap Correlogram Bubble Connected Scatter 2D Density
plt.scatter()
sns.scatterplot()

Ranking

Bar plot Lollipop plot Parallel coords. Radar chart Word cloud
plt.scatter()
sns.scatterplot()
parallel_coordinates(df, 'cls')

Grupos

Stacked bar plot Pie chart Donut chart Dendrogram Treemap Venn diagram

EDA no supervisado

Referencias