Cómo encontrar el coeficiente de correlación con Excel

Cómo encontrar el coeficiente de correlación con Excel / Productividad

Uno de los cálculos estadísticos de Excel más simples y comunes Cómo calcular estadísticas básicas en Excel: una guía para principiantes Cómo calcular estadísticas básicas en Excel: una guía para principiantes ¡Microsoft Excel puede hacer estadísticas! Puede calcular porcentajes, promedios, desviación estándar, error estándar y pruebas T de Student. Leer más que podría hacer es la correlación. Es una estadística simple, pero puede ser muy informativa cuando se quiere ver si dos variables están relacionadas. Si conoce los comandos correctos, encontrar el coeficiente de correlación en Excel es extremadamente fácil.

Vamos a echar un vistazo a la correlación para darle una idea de la información que le proporciona. Luego pasaremos a encontrar el coeficiente de correlación en Excel usando dos métodos y una buena gráfica para observar las correlaciones. Finalmente, le daré una introducción muy rápida a la regresión lineal, otra función estadística que podría resultar útil cuando se observan correlaciones..

¿Qué es la correlación??

Antes de comenzar, discutamos la definición de correlación. Es una medida simple de cómo se relacionan las cosas. Echemos un vistazo a dos variables que no tienen correlación alguna.

Estas dos variables (una trazada en el eje X, una en la Y) son totalmente aleatorias y no están estrechamente relacionadas.

Las dos variables a continuación, sin embargo, están correlacionadas:

En general, a medida que una variable aumenta, también lo hace la otra. Eso es correlación. (Tenga en cuenta que también puede ser al revés; si uno sube y el otro baja, eso es una correlación negativa).

Entendiendo el coeficiente de correlación

El coeficiente de correlación le indica cómo están relacionadas dos variables. El coeficiente está entre -1 y 1. Un coeficiente de correlación de 0 significa que no hay absolutamente ninguna correlación entre dos variables. Esto es lo que debe obtener cuando tiene dos conjuntos de números aleatorios.

Un coeficiente de -1 significa que tiene una perfecta correlación negativa: a medida que aumenta una variable, la otra disminuye proporcionalmente. Un coeficiente de 1 es una correlación positiva perfecta: a medida que aumenta una variable, la otra también aumenta proporcionalmente.

Cualquier número entre esos representa una escala. Una correlación de .5, por ejemplo, es una correlación positiva moderada.

Como puede ver en el gráfico a continuación, la correlación solo busca una relación lineal. Dos variables se pueden relacionar fuertemente de otra manera y aún tienen un coeficiente de correlación de cero:

Crédito de la imagen: DenisBoigelot / Wikimedia Commons

Cómo encontrar el coeficiente de correlación en Excel usando CORREL

Hay una función incorporada para la correlación en Excel. La función CORREL tiene una sintaxis muy simple:

= CORREL (array1, array2)

array1 es su primer grupo de números, y array2 es el segundo grupo. Excel escupirá un número, y ese es su coeficiente de correlación. Veamos un ejemplo.

En esta hoja de cálculo, tenemos una lista de autos, con modelo y año, y sus valores. Usé la función CORREL para ver si el año y el valor del modelo estaban relacionados:

Hay una correlación positiva muy débil; a medida que aumenta el año, también lo hace el valor del vehículo. Pero no por mucho.

Graficando correlaciones

Cuando está ejecutando correlaciones, es una buena idea usar un diagrama de dispersión para obtener una comprensión visual de cómo se relacionan sus conjuntos de datos. Ir Gráficos> Dispersión para ver cómo se ven tus datos:

Puede ver que en estos datos, el año del automóvil no afecta mucho el valor. Hay una leve Tendencia positiva, pero es débil. Eso es lo que encontramos con nuestra función CORREL..

Otro elemento útil en un diagrama de dispersión es una línea de tendencia, que se ve así:

La línea de tendencia puede ser útil cuando desea aclarar la correlación en su diagrama de dispersión. En Windows, haga clic en Herramientas de gráfico> Diseño> Agregar elemento de gráfico y seleccione línea de tendencia. En una Mac, tendrás que ir a Diseño gráfico o Diseño gráfico, Dependiendo de la edición de Excel..

Y no se olvide de consultar nuestra guía para crear excelentes gráficos en Excel. Cómo crear gráficos y cuadros de gran alcance en Microsoft Excel. Cómo crear gráficos y cuadros de gran alcance en Microsoft Excel. Un buen gráfico puede marcar la diferencia entre expresar su punto o partir todo el mundo dormitando Le mostramos cómo crear gráficos potentes en Microsoft Excel que atraigan e informen a su audiencia. Lea más antes de presentar cualquier hallazgo!

Correlacionar múltiples variables con el paquete de herramientas de análisis de datos

Si tiene muchos conjuntos de números diferentes y desea buscar correlaciones entre ellos, debe ejecutar la función CORREL en cada combinación. Sin embargo, al usar el Data Analysis Toolpak, puede seleccionar una serie de conjuntos de datos y ver dónde se encuentran las correlaciones..

¿No está seguro si tiene el Data Analysis Toolpak? Vea nuestro tutorial de lo básico Cómo hacer un análisis de datos básico en Excel Cómo hacer un análisis de datos básico en Excel Excel no está diseñado para el análisis de datos, pero aún puede manejar estadísticas. Le mostraremos cómo usar el complemento Data Analysis Toolpak para ejecutar las estadísticas de Excel. Lee más para descargar y aprender a usarlo..

Para encender el Toolpak, vaya a Datos> Análisis de datos. Verás una lista de opciones:

Seleccionar Correlación y golpear DE ACUERDO.

En la ventana resultante, seleccione todos sus conjuntos de datos en la Rango de entrada e indique a Excel dónde desea que se coloquen los resultados:

Esto es lo que obtendrás cuando golpees DE ACUERDO:

En la imagen de arriba, hemos ejecutado correlaciones en cuatro conjuntos de datos diferentes: el año, la población mundial y dos conjuntos de números aleatorios.

La correlación de cada conjunto de datos consigo mismo es 1. El año y la población mundial tienen una correlación extremadamente fuerte, mientras que existen correlaciones muy débiles en otros lugares, como es de esperar con números aleatorios..

Correlación vs. Regresión Lineal en Excel

La correlación es una medida simple: ¿qué tan estrechamente relacionadas están dos variables? Esta medida, sin embargo, no tiene ningún valor predictivo o causativo.. El hecho de que dos variables estén correlacionadas no significa que una esté causando cambios en la otra. Eso es algo crucial para entender acerca de la correlación..

Si está interesado en hacer una afirmación sobre la causalidad, deberá utilizar la regresión lineal. También puede acceder a esto a través de Data Analysis Toolpak. (Este artículo no cubre los detalles de cómo funciona la regresión lineal, pero hay muchos recursos estadísticos gratuitos. Aprenda estadísticas gratis con estos 6 recursos. Aprenda estadísticas gratis con estos 6 recursos. Las estadísticas tienen una reputación de un tema que es difícil de entender. . Pero aprender del recurso correcto lo ayudará a comprender los resultados de la encuesta, los informes de elecciones y las asignaciones de la clase de estadísticas en poco tiempo. Lea más que puede guiarlo a través de los conceptos básicos.

Abra el Paquete de herramientas de análisis de datos, seleccione Regresión, y haga clic DE ACUERDO.

Llene los rangos X e Y (el valor X es la variable explicativa, y el valor Y es el valor que está tratando de predecir). A continuación, seleccione dónde desea que vaya su salida y haga clic en DE ACUERDO otra vez.

El número en el que querrás enfocarte es el valor p para tu variable explicativa:

Si es menos de 0.05, tiene un fuerte argumento de que los cambios en su variable X están causando cambios en su variable Y. En la imagen de arriba, hemos demostrado que el año es un predictor significativo de la población mundial..

La regresión lineal también es útil porque puede observar múltiples valores. Aquí, hemos usado la regresión para ver si el año y la población son predictores significativos del precio del petróleo crudo:

Ambos valores de p son inferiores a 0,05, por lo que podemos concluir que tanto el año como la población mundial son predictores significativos del precio del petróleo crudo. (Aunque las correlaciones fuertes entre las variables X pueden causar sus propios problemas).

Nuevamente, esta es una explicación muy simplista de la regresión lineal, y si estás interesado en la causalidad, deberías leer algunos tutoriales de estadísticas..

Pero ahora tiene una idea de cómo ir más allá de la simple correlación si está buscando más información estadística.!

Obtenga mejores datos de Excel

Comprender las funciones estadísticas básicas en Excel puede ayudarlo a obtener mucha más información útil de sus datos. La correlación es una medida simple, pero puede ser de gran ayuda cuando intenta hacer reclamos sobre los números en su hoja de cálculo..

Por supuesto, puede ejecutar un montón de otras medidas más complicadas. Pero a menos que se sienta cómodo con las estadísticas, querrá comenzar con lo básico 8 Consejos para aprender a aprender Excel rápidamente 8 Consejos para aprender a aprender Excel rápidamente ¿No está tan cómodo con Excel como quisiera? Comience con consejos simples para agregar fórmulas y administrar datos. Sigue esta guía y estarás al día en poco tiempo. Lee mas .

¿Usas la funcionalidad de correlación de Excel regularmente? ¿Qué otras funciones estadísticas te gustaría aprender??

Explorar más sobre: ​​Microsoft Excel.