Uno de los principales problemas que plantea la regresión es el de encontrar la mejor ecuación lineal a partir de una lista determinada de posibles variables de regresión. El artículo tiene como objetivo comentar el método de generación de todas las regresiones posibles con posterior comparación mediante el método C de Mallows, ilustrando el procedimiento con la aplicación del método a un caso real.
En este artículo se plantea la necesidad de utilizar representaciones gráficas, antes, durante y después del análisis numérico de los datos. En particular, se sugieren dos gráficos: el de cuantilas y el de caja, señalando, en aplicaciones con datos reales, sus ventajas respecto a los procedimientos clásicos. Además, se propone una posible metodología, que permite generalizar el uso exploratorio del gráfico de caja para tratar datos procedentes de distribuciones no normales.
Considerar por primera vez un conjunto de datos para analizarlos estadísticamente, requiere adoptar una cierta actitud frente a la información recogida, más que someterla automáticamente a un conjunto de técnicas de análisis. Este artículo es el primero de una serie que se denomina genéricamente Análisis Exploratorio de Datos, cuyo objetivo global es proporcionar alternativas a la aproximación descriptiva que la estadística clásica propone. Se establece a continuación un marco adecuado para proceder...
Download Results (CSV)