¡El análisis de datos es para todos!

por: 
Tierney Smith (TechSoup Canada)
Written on: 
Abril 17, 2013

 

Visualización de datos, generación de informes y cuadros de mando

Hay un montón de herramientas de lujo que hay para el análisis de datos - algunas de las cuales son sumamente complejos, y algunos de los cuales son en realidad bastante simple de usar y configurar (incluyendo algunos productos en nuestro programa de donaciones tales como BI OnDemand). Si usted está buscando para dar el paso siguiente bebé en el camino hacia el uso de sus datos para tomar mejores decisiones, un buen punto de partida podría ser la de tomar un segundo vistazo a la hoja de cálculo como en los viejos tiempos. Programas de hojas de cálculo tienen una gran cantidad de herramientas de análisis de datos construido a la derecha adentro, y hoy quiero hablar de una característica menos conocida (en mi experiencia) pero muy potente: las tablas dinámicas

Las tablas pivote se encuentran disponibles en la mayoría de programas de hoja de cálculo que puede usar (que incluso se han añadido recientemente a Google Spreadsheets), pero en este post me centraré en Excel 2010 ya que es lo que más me usando en ese momento. En las tablas pivote realmente brillan es cuando usted tiene una mesa grande, sencillo lleno de datos y desea hacer algunos vínculos entre los diferentes tipos de datos (más allá de lo que puede hacer con filtros y clasificación). En particular, las tablas dinámicas puede ser una excelente manera de explorar sus datos si no estás muy seguro de lo que está buscando todavía.

El contexto: solicitudes de seguimiento de donación

Para mostrar lo que estoy hablando, te voy a dar un ejemplo que es directamente relevante para nuestro trabajo aquí en TechSoup Canadá: seguimiento de las solicitudes de productos en nuestro programa de donaciones. Puedo hacer una exportación desde mi base de datos para obtener una hoja de cálculo grande y bonita en la que cada fila representa un producto que se ordenó.

Obviamente he despojado a cabo una gran cantidad de datos (como el nombre de la organización y la información, y el producto se ha pedido), pero lo que me queda en algunos de los otros datos como el tipo de organización que ordenó el producto (es decir, cuál es su La misión principal), la provincia donde la organización es de, al número de licencias del producto que ordenó (por ejemplo, una orden puede incluir 5 licencias de Microsoft Office) y la fecha que pedimos.

Hoja de datos del pedido

Así que si quieres saber el número de pedidos que tuvimos en un mes determinado, es bastante simple. Sólo quiero usar Excel auto-filtro para filtrar el mes y el año y luego contar hasta que todas las filas.

Pregunta 1: ¿de qué provincia podemos conseguir la mayoría de los pedidos?

Pero, ¿si lo que quiero es hacer algo más complejo? Digamos que quiero averiguar qué provincia se obtiene la mayor cantidad de órdenes. Yo podría hacer un poco de ordenar y contar, sino que implicaría una gran cantidad de trabajo manual. ¡Aquí es donde las tablas dinámicas venir al rescate! Puedo seleccionar los datos que quiero (que es mi tabla completa de datos, todas las filas y columnas) y vaya a Insertar -> Tabla Pivot.

Ahora bien, si usted nunca ha usado antes de tablas dinámicas, la pantalla que se obtiene puede ser bastante confuso:

Nueva tabla dinámica

¡No se deje intimidar! Lo que hay que hacer es tratar de visualizar el informe que desee y, a continuación, arrastre los campos desde la lista de la derecha en su lugar en la mesa o las cajas de la derecha.

Si usted está luchando para averiguar dónde va cada cosa, sólo tiene que probarlo y ver si tiene sentido o no. En este caso, permítanme reformular mi pregunta en términos de mis datos: Quiero saber qué provincia tiene la mayor cantidad de licencias solicitadas en general.

Voy a empezar arrastrando "Provincia" a las "Etiquetas de fila", por lo que obtener una lista de todas las provincias, y luego voy a arrastrar "Cantidad" a "Valores". Por defecto está haciendo un recuento de las cantidades, así que haga clic derecho ve a Ajustes valor del campo y elija suma. Ahora tengo una lista de todas las provincias y el número total de licencias que se han pedido de cada uno.

Esto es muy bueno, pero es difícil ver cuál es el más popular. Así que lo que voy a hacer es hacer clic en la pequeña flecha de "Provincia" (la cabecera de la mesa), escoja "más opciones de Sort". Después de un poco de jugar un rato, me di cuenta de que puedo elegir "descendente (de la Z a la A)" y seleccionar "Suma de Cantidad" y ordeno que clasifique las provincias en orden decreciente según el número de licencia. En otras palabras, la provincia que ordenó la mayoría de las licencias se encuentra en la parte superior:

Número de licencias ordenadas por provincia

Como era de esperar, se obtiene la mayor cantidad de pedidos de Ontario. Esto tiene sentido porque hay un buen montón de organizaciones de caridad, organizaciones no lucrativas y bibliotecas en Ontario. Sin embargo, también significa que tenemos que hacer más difusión a otras provincias para correr la voz sobre el programa de donaciones. Así que podemos usar estos datos para informar a nuestros esfuerzos de alcance y asegurar que nuestro tiempo se utiliza con mayor eficacia, donde más se necesita.

Pregunta 2: ¿En qué mes se obtiene la mayor cantidad de pedidos?

Así que ya que ésta es muy divertida, vamos a hacer un ejemplo más. Esta vez quiero ver una tendencia en el número de pedidos por mes, para ver en qué mes se obtiene la mayor cantidad de pedidos. Una vez más, voy a seleccionar todos mis datos en la hoja de cálculo principal, pero esta vez voy a hacer uso de la más reciente de Excel "Tabla Pivot" característica y elegir Insertar -> Gráfico dinámico.

Al igual que antes, voy a construir la tabla para mostrar mis datos en la forma que yo quiero, pero ya tomé la opción Gráfico dinámico, Excel también se me va a hacer un gráfico de mis datos, que hará que sea más fácil de visualizar la tendencia.

Nueva tabla pivote

Ya que quiero ver el tiempo en el eje horizontal de mi carta, voy a arrastrar "Año" y "Mes" al "Campo Axis" sección. Los datos que quiero ver es el número de pedidos, así que voy a arrastrar "Cantidad" a "Valores". Me doy cuenta de que está configurado automáticamente para contar los valores en lugar de sumarlos, que es lo que quiero en este caso (me gustaría saber sobre el número de órdenes, no licencias individuales). Así que ahora tengo una mesa con mis valores, y un gráfico, así:

Gráfico de barras que muestra los pedidos por mes

Ahora bien, esto se ve bien, pero un gráfico de barras - que es el valor por defecto - no es realmente la mejor opción para mostrar una tendencia en el tiempo. En cambio, me voy a cambiar el tipo de gráfico para ser un gráfico de líneas. Además, voy a hacer un poco de limpieza por lo que el cuadro es más fácil de leer.

Gráfica de líneas de órdenes por mes

Ahora, puedo ver claramente algunas tendencias en mis datos. Por ejemplo, puedo ver que marzo y junio tienen picos en los 3 años que se muestran aquí. Si asocio esto a mi conocimiento general sobre el sector y el programa de donaciones, ya sé que marzo es alta porque el año sin fines de lucro de muchos fiscal termina el 31 de marzo y junio de ese año es alta debido a que muchos de nuestros programas de donantes restablecer sus límites adjudicación al finales de junio. Ahora que estoy informado de estos datos, puedo empezar a tomar decisiones tales como dedicar tiempo adicional del personal de servicio al cliente durante estos meses.

Por supuesto, todo esto es apenas arañar la superficie, hay muchas otras maneras en que podría picadillo estos datos. Como mencioné al principio de este post, ser capaz de jugar un poco con facilidad sus datos le ayudarán a descubrir tendencias y saber que las opiniones de sus datos son las más valiosas. Al final del día, esto le ayudará a estar más informados y datos para contar mejor la historia de su organización a través de los datos.

¿Ha utilizado las tablas dinámicas? ¿De qué manera / herramientas para el análisis de los datos se ha encontrado de utilidad?