❓ Missing values
- Missings de cada celda
df.isnull()
- Plot
sb.heatmap(df.isnull())
- Plot
- Missings de cada variable
df.isnull().sum(axis=0)
odf.isnull().sum()
- Ordenados:
df.isnull().sum().sort_values(ascending=False)
- En porcentaje:
df.isnull().sum() / len(df) * 100
- Ordenados:
- Missings de cada fila
df.isnull().sum(axis=1)
Paquete missingno
Los ejemplos que se muestran hacen uso del dataset NYPD Motor Vehicle Collisions Dataset.
import missingno
import pandas as pd
df = pd.read_csv("https://raw.githubusercontent.com/ResidentMario/missingno-data/master/nyc_collision_factors.csv")
Bar
missingno.bar(df)
Matrix
missingno.matrix(df)
Heatmap
missingno.heatmap(df)
Dendrogram
missingno.dendrogram(df)