Introducción al Machine Learning
Software
Ingeniería de características = CREATIVIDAD + CONOCIMIENTO DEL DOMINIO
La ingeniería de características (Feature Engineering) es la generación de nuevas características en base a las ya existentes. Esto facilita el trabajo a nuestros modelos.
- Si tienes el precio de la casa y los metros cuadrados, puedes añadir el precio del metro cuadrado.
- Si tines la distancia en el eje x e y, puedes añadir la distancia directa por pitagoras.
- Si tines precios, puedes añanir la parte fraccionaria pq es muy subjetiva en la gente.
Fuga de datos
La fuga de datos conocida como Data Leakage en inglés, es cuando se introducen datos los cuales son imposibles de disponer en la vida real.
- Perfect score script used to probe leaderboard
- Page about data leakages on Kaggle
- Another page about data leakages on Kaggle