Cómo hacer análisis de datos básicos en Excel
La mayoría de las veces, cuando ejecuta estadísticas, desea utilizar software estadístico. Estas herramientas están diseñadas para hacer cálculos como t-Pruebas, pruebas de chi-cuadrado, correlaciones, etc. Excel no es para el análisis de datos. Pero eso no significa que no puedas hacerlo..
Desafortunadamente, las funciones estadísticas de Excel no siempre son intuitivas. Y usualmente te dan resultados esotéricos. Entonces, en lugar de usar las funciones de estadísticas, usaremos el complemento de estadísticas de Excel para ir a: el Data Analysis Toolpak.
El Toolpak, a pesar de su ortografía bastante desafortunada, incluye una amplia gama de funcionalidades estadísticas útiles. Veamos qué podemos hacer con las estadísticas de Excel..
Agregando las herramientas de análisis de datos de Excel
Mientras tu puede hacer estadísticas sin el Data Analysis Toolpak, es mucho más fácil con él. Para instalar el Toolpak en Excel 2016, vaya a Archivo> Opciones> Complementos.
Hacer clic Ir cerca de “Administrar: Excel Complementos.”
En la ventana resultante, marque la casilla junto a Herramientas de análisis y luego haga clic DE ACUERDO.
Si ha agregado correctamente el Data Analysis Toolpak a Excel, verá un Análisis de los datos botón en el Datos pestaña, agrupada en el Análisis sección:
Si desea aún más poder, asegúrese de revisar los otros complementos de Excel Power Up Excel con 10 complementos para procesar, analizar y visualizar datos como un Pro Power Up Excel con 10 complementos para procesar, analizar y visualizar datos Al igual que un Pro Vanilla Excel es increíble, pero puedes hacerlo aún más poderoso con los complementos. Cualquiera que sea la información que necesite procesar, es probable que alguien haya creado una aplicación de Excel para ella. Aquí hay una selección. Lee mas .
Estadística Descriptiva en Excel
No importa qué prueba estadística esté ejecutando, es probable que desee obtener primero las estadísticas descriptivas de Excel. Esto le dará información sobre medias, medianas, varianza, desviación estándar y error, curtosis, sesgo y una variedad de otras figuras..
Ejecutar estadísticas descriptivas en Excel es fácil. Hacer clic Análisis de los datos en la pestaña Datos, seleccione Estadísticas descriptivas, y seleccione su rango de entrada. Haga clic en la flecha al lado del campo de rango de entrada, haga clic y arrastre para seleccionar sus datos y presione Entrar (o haga clic en la flecha hacia abajo correspondiente), como en el GIF a continuación.
Después de eso, asegúrese de decirle a Excel si sus datos tienen etiquetas, si desea el resultado en una hoja nueva o en la misma, y si desea estadísticas de resumen y otras opciones.
Despues de eso, golpea DE ACUERDO, y obtendrás tus estadísticas descriptivas:
Prueba t de Student en Excel
los t-La prueba es una de las pruebas estadísticas más básicas, y es fácil de calcular en Excel con el Toolpak. Haga clic en el Análisis de los datos botón y desplácese hacia abajo hasta que vea el t-opciones de prueba.
Tienes tres opciones:
- t-Test: Dos muestras pareadas para medias debe utilizarse cuando sus mediciones u observaciones fueron emparejadas. Use esto cuando tomó dos medidas de los mismos sujetos, como medir la presión arterial antes y después de una intervención.
- Prueba t: Dos muestras que suponen varianzas iguales debe usarse cuando sus mediciones son independientes (lo que generalmente significa que se realizaron en dos grupos de sujetos diferentes). Discutiremos la “varianzas iguales” parte en un momento.
- t-Test: Dos muestras asumiendo variaciones desiguales también es para mediciones independientes, pero se usa cuando sus variaciones son desiguales.
Para probar si las variaciones de sus dos muestras son iguales, deberá ejecutar una prueba F. Encontrar Prueba F de dos muestras para variaciones en la lista Herramientas de análisis, selecciónela y haga clic en DE ACUERDO.
Introduzca sus dos conjuntos de datos en los cuadros de rango de entrada. Deje el valor alfa en 0.05 a menos que tenga una razón para cambiarlo; si no sabe lo que eso significa, simplemente váyase. Por último, haga clic en DE ACUERDO.
Excel le dará los resultados en una nueva hoja (a menos que haya seleccionado Rango de salida y una celda en su hoja actual):
Estás viendo el valor de p aquí. Si es menos de 0.05, tienes varianzas desiguales. Así que para ejecutar el t-prueba, deberías usar la opción de varianzas desiguales.
Para ejecutar un t-prueba, seleccione la prueba apropiada de la ventana Herramientas de análisis y seleccione ambos conjuntos de sus datos de la misma manera que lo hizo para la prueba F. Deja el valor alfa en 0.05, y pulsa DE ACUERDO.
Los resultados incluyen todo lo que necesita reportar para una t-prueba: los medios, los grados de libertad (df), el estadístico t y los valores P para las pruebas de una y dos colas. Si el valor P es menor que 0.05, las dos muestras son significativamente diferentes.
Si no estás seguro de si usar uno o dos colas t-prueba, echa un vistazo a este explicador de UCLA.
ANOVA en Excel
El Excel Data Analysis Toolpak ofrece tres tipos de análisis de varianza (ANOVA). Desafortunadamente, no le permite realizar las pruebas de seguimiento necesarias como Tukey o Bonferroni. Pero puedes ver si hay una relación entre unas pocas variables diferentes.
Aquí están las tres pruebas ANOVA en Excel:
- ANOVA: factor único analiza la varianza con una variable dependiente y una variable independiente. Es preferible usar múltiples t-Pruebas cuando tienes más de dos grupos..
- ANOVA: dos factores con replicación es similar a la pareja t-prueba; Implica mediciones múltiples en sujetos individuales. los “dos factores” Parte de esta prueba indica que hay dos variables independientes..
- ANOVA: dos factores sin replicación Implica dos variables independientes, pero ninguna replicación en la medición..
Vamos a repasar el análisis de un solo factor aquí. En nuestro ejemplo, veremos tres conjuntos de números, etiquetados “Intervención 1,” “Intervención 2,” y “Intervención 3.” Para ejecutar un ANOVA, haga clic en Análisis de los datos, luego selecciona ANOVA: factor único.
Seleccione el rango de entrada y asegúrese de decirle a Excel si sus grupos están en columnas o filas. También he seleccionado “Etiquetas en primera fila” Aquí para que los nombres de los grupos se muestren en los resultados..
Después de golpear DE ACUERDO, obtenemos los siguientes resultados:
Tenga en cuenta que el valor P es menor que 0.05, por lo que tenemos un resultado significativo. Eso significa que hay una diferencia significativa entre al menos dos de los grupos en la prueba. Pero porque Excel no proporciona pruebas para determinar cual los grupos difieren, lo mejor que puede hacer es mirar los promedios mostrados en el resumen. En nuestro ejemplo, Intervention 3 parece que es probablemente el que difiere.
Esto no es estadísticamente correcto. Pero si solo quieres ver si hay una diferencia, y ver qué grupo probablemente la está causando, funcionará.
El ANOVA de dos factores es más complicado. Si desea obtener más información sobre cuándo usar el método de dos factores, vea este video de Sophia.org y el “sin replicación” y “con replicación” ejemplos de estadísticas reales.
Correlación en Excel
Calcular la correlación en Excel es mucho más simple que la t-prueba o un ANOVA. Utilizar el Análisis de los datos para abrir la ventana de Herramientas de análisis y seleccionar Correlación.
Seleccione su rango de entrada, identifique sus grupos como columnas o filas e informe a Excel si tiene etiquetas. Despues de eso, golpea DE ACUERDO.
No obtendrás ninguna medida de importancia, pero puedes ver cómo cada grupo se correlaciona con los otros. Un valor de uno es una correlación absoluta, que indica que los valores son exactamente iguales. Cuanto más cerca está de uno el valor de correlación, más fuerte es la correlación.
Regresión en Excel
La regresión es una de las pruebas estadísticas más utilizadas en la industria, y Excel tiene una sorprendente cantidad de potencia para este cálculo. Ejecutaremos una rápida regresión múltiple en Excel aquí. Si no está familiarizado con la regresión, consulte la guía de HBR sobre el uso de la regresión para empresas.
Digamos que nuestra variable dependiente es la presión arterial, y nuestras dos variables independientes son el peso y la ingesta de sal. Queremos ver cuál es un mejor predictor de la presión arterial (o si ambos están bien).
Hacer clic Análisis de los datos y seleccione Regresión. Debe tener cuidado al completar los cuadros de rango de entrada esta vez. los Rango de entrada Y cuadro debe contener su única variable dependiente. los Rango de entrada X El cuadro puede incluir múltiples variables independientes. Para una regresión simple, no se preocupe por el resto (aunque recuerde informarle a Excel si seleccionó etiquetas).
Así es como se ve nuestro cálculo:
Después de golpear DE ACUERDO, Obtendrá una gran lista de resultados. He resaltado el valor P aquí para el peso y la ingesta de sal:
Como puede ver, el valor P para el peso es mayor que 0.05, por lo que no existe una relación significativa allí. El valor P para la sal, sin embargo, está por debajo de 0.05, lo que indica que es un buen predictor de la presión arterial.
Si planea presentar sus datos de regresión, recuerde que puede agregar una línea de regresión a un diagrama de dispersión en Excel. Es una gran ayuda visual Cómo visualizar su análisis de datos con Power Tools de Excel Cómo visualizar su análisis de datos con Power Tools Excel de Excel lo está matando con sus funciones avanzadas de administración de datos. Una vez que haya utilizado una de las nuevas herramientas, las querrá todas. ¡Conviértete en un maestro de tu análisis de datos con herramientas de poder! Leer más para este análisis.
Estadísticas de Excel: Sorprendentemente capaz
Si bien Excel no es conocido por su poder estadístico, en realidad contiene algunas funciones realmente útiles. Especialmente una vez que descargues el complemento Data Statistics Toolpak. Espero que hayas aprendido a usar el Toolpak, y que ahora puedas jugar solo para descubrir cómo usar más sus funciones..
Con esto ahora bajo su cinturón, lleve sus habilidades de Excel al siguiente nivel con nuestros artículos sobre el uso de la función de búsqueda de objetivos de Excel para obtener más información sobre el procesamiento de datos, dominar las declaraciones IF en Excel y agregar listas desplegables como celdas en Excel.
También me he vinculado a otros sitios que tienen buenos tutoriales de estadísticas en los que tuvimos que saltearnos conceptos confusos. Asegúrese de consultar nuestra guía de recursos estadísticos gratuitos Aprenda estadísticas gratis con estos 6 recursos Aprenda estadísticas gratis con estos 6 recursos Estadísticas tiene una reputación de un tema que es difícil de entender. Pero aprender del recurso correcto lo ayudará a comprender los resultados de la encuesta, los informes de elecciones y las asignaciones de su clase de estadísticas en ningún momento. Leer más, también.
Explorar más sobre: Microsoft Excel, Hoja de cálculo.