sábado, 13 de junio de 2015

Algunos apuntes sobre aprendizaje automático

1. Usar coeficiente de correlación de Pearson para medir similitudes entre ejemplos

Es interesante aplicar el coeficiente de correlación de Pearson en sustitución de la distancia Euclídea con el objetivo de obtener la similitud entre dos ejemplos cuando sus atributos, pese a estar normalizados, pueden manifestar comportamientos comunes estando en diferentes escalas de valores. Además, la distancia Euclídea es mayor conforme aumenta el número de atributos, aunque las diferencias entre ellos sean las mismas. El coeficiente de correlación de Pearson es insensible a estas cuestiones y preserva la similitud entre los ejemplos.