¿Que es Power Query y para qué sirve?

Power Query es una herramienta de Extracción, Transformación y Carga (ETL) que ayuda a los usuarios de Power BI y Excel a conectar con datos, transformar su formato como se necesite y cargar los datos para su uso futuro, típicamente en Power BI, Excel, archivos CSV, etc.

Power Query es un motor de transformación y preparación de datos. Incluye un interfaz gráfico para obtener datos de diferentes orígenes y un Editor (Power Query Editor) para aplicar las transformaciones.

¿Cuándo utilizar Power Query?

Power Query es especialmente útil cuando:

Se procesan grandes cantidades de datos (Excel está limitado a un millón de filas)

  • Se importan datos de diferentes orígenes (Excel, CSV, SharePoint, SQl, Salesforce)
  • Se necesita manipular, limpiar y combinar varias tablas, archivos o incluso carpetas.

Power Query contiene un interfaz gráfico para obtener los datos de sus fuentes de datos y un Editor Power Query para aplicar transformaciones. Como el motor de Power Query está disponible en muchos productos y servicios, el punto de destino donde se guardarán los datos depende de dónde se use Power Query.

¿Por qué es conveniente usar Power Query?

Según un estudio sobre ML y Data Science de Kaggle entre cerca de 16.000 profesionales, la comunidad en línea de científicos de datos y profesionales del aprendizaje automático, los científicos de datos, analistas o ingenieros de software emplean alrededor de un 40% de su tiempo recopilando, preparando y limpiando los datos para poder utilizarlos en sus análisis. Esto supone una enorme cantidad de tiempo, que Power Query reduce drásticamente con sus capacidades. Los usuarios que lo han probado hablan de reducir tareas en las que empleaban tres horas a solo tres minutos.

Todo el que usa Excel 2010 o posteriores tiene acceso a Power Query, ya que es una herramienta construida por Microsoft para Excel. Esta misma herramienta se encuentra en Power BI, por lo que basta con aprenderla a usar una vez para utilizarla en ambas aplicaciones. Si tienes Excel 2016 o superior, encontrarás las herramientas de Power Query en la pestaña de Datos de la cinta superior del menú en pantalla, dentro del grupo de herramientas de “obtener y transformar” (Get and transform).

Si estás en las versiones 2010 o 2013, puedes descargar el Add-In (complemento) gratuito de Power Query, que entonces tendrá su propia pestaña en la cinta. La herramienta no está disponible en Excel 2007 o anteriores versiones.

En Power BI Desktop, las herramientas de Power Query están en la pestaña inicio de la cinta. En la encuesta mencionada muchos son Científicos de Datos que trabajan con datos bastante cuidados, y muchos de nosotros hacemos tareas sobre la marcha en las que seguramente empleamos mucho más tiempo en la preparación de los datos. De hecho, otros estudios como el de Crowdflower apuntan a que cerca del 80% de los analistas se pierde en la recopilación y limpieza de datos. Quizá sea exagerado, pero un 40% del tiempo ya es mucho decir, y ahorrar una parte considerable de este tiempo tendrá una mejora en productividad espectacular.

Power Query es capaz de automatizar la ingesta y limpieza de datos tradicional. Hasta ahora, muchos hemos automatizado tareas usando el lenguaje de programación de Excel VBA, pero Power Query no precisa de conocimiento alguno de programación. La mayoría de sus herramientas están disponible en la interfaz gráfica por el método de apuntar y hacer clic. Así, con facilidad podemos reducir tareas que llevaban horas a tan solo unos segundos. Power Query supera a VBA en velocidad y, ha demostrado ser un poco más estable cuando se trata de des pivotar conjuntos de datos. No solo eso, sino que tampoco exige aprender ningún código, lo cual es una gran ventaja.

Power Query puede tomar datos sin preparar de una enorme gama de fuentes, incluyendo tablas de las hojas Excel, de otros Excel, archivos de texto o CSV, incluso múltiples archivos en una carpeta o tablas de datos de PDF, también fuentes de datos Json y XML y bases de datos incluyendo SQL, Microsoft Access, Analysis Services o incluso sistemas propietarios con conectores ODBC u OLE DB. La lista es profusa, ya que podemos mencionar además Servicios Azure y la web, o sistemas en la nube como SharePoint, Exchange, Salesforce o Dynamics 365. La lista se amplía de forma considerable si usamos Power Query en Power BI.

A partir de una o varias de estas fuentes, podemos limpiar y transformar datos desordenados en datos perfectamente tabulados, usando la intuitiva interfaz de usuarios con el clic de un botón, lo que nos deja mucho más tiempo disponible para la parte inteligente de análisis y visualización.

Power BI Desktop vs. Excel

Power BI sirve para publicar y compartir reportes y visualizaciones de forma interactiva y en formato web. Las ventajas son claras:

  • Power BI es muy fácil de usar, interactivo e intuitivo.
  • Power BI puede trabajar con mayor volumen de información, sin las limitaciones de número de filas y gráficas de Excel
  • Permite compartir informes fácilmente
  • Las capacidades de visualización de Power Bi son muy superiores a las de Excel

Fuente: pe.cosmoconsult.com

Comments

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *