Una cuestión que me llamó la atención en clase (cuando estábamos trabajando el primer tema en la asignatura Matemáticas y su Didáctica III), fue qué era el Análisis Exploratorio de Datos y en qué consistía, por ello he querido buscar información sobre este aspecto, y dedicarle una entrada del blog.
El Análisis Exploratorio de Datos (A.E.D.) es un conjunto de técnicas estadísticas cuya finalidad es conseguir un entendimiento básico de los datos y de las relaciones existentes entre las variables analizadas. Para conseguir este objetivo el A.E.D. proporciona métodos sistemáticos sencillos para organizar y preparar los datos, detectar fallos en el diseño y recogida de los mismos, tratamiento y evaluación de datos ausentes (missing), identificación de casos atípicos (outliers) y comprobación de los supuestos subyacentes en la mayor parte de las técnicas multivariantes (normalidad, linealidad, homocedasticidad).
Por lo tanto su finalidad es examinar los datos previamente a la aplicación de cualquier técnica estadística. De esta forma el analista consigue un entendimiento básico de sus datos y de las relaciones existentes entre las variables analizadas.
Las etapas que debe seguir son las siguientes:
-Preparar los datos para hacerlos accesibles a cualquier técnica estadística.
-Realizar un examen gráfico de la naturaleza de las variables individuales a analizar y un análisis descriptivo numérico que permita cuantificar algunos aspectos gráficos de los datos.
-Realizar un examen gráfico de las relaciones entre las variables analizadas y un análisis descriptivo numérico que cuantifique el grado de interrelación existente entre ellas.
-Evaluar, si fuera necesario, algunos supuestos básicos subyacentes a muchas técnicas estadísticas como, por ejemplo, la normalidad, linealidad y homocedasticidad.
-Identificar los posibles casos atípicos (outliers) y evaluar el impacto potencial que puedan ejercer en análisis estadísticos posteriores.
-Evaluar, si fuera necesario, el impacto potencial que pueden tener los datos ausentes (missing) sobre la representatividad de los datos analizados.
Fuente utilizada:
Salvador, Figueras, M y Gargallo, P. (2003). Análisis exploratorio de datos. Recuperado el 8/10/2014 de: http://ciberconta.unizar.es/leccion/aed/inicio.html
No hay comentarios:
Publicar un comentario