Ante la complejización de los sistemas eléctricos, ¿qué principal recomendación hace para prepararse a la eventual masificación de las energías renovables en la cobertura del consumo eléctrico? 

Es importante empezar a registrar más datos de los sistemas. Hoy, hay instalaciones que se hacen y no se les agregan medidores que se conectan a wifi; la situación que se genera es que empiezan a haber sistemas que llevan dos años funcionando sin registrar datos en la nube sólo porque al usuario o instalador no le interesó obtener más información que podría ser valiosa para la red y el propio usuario. 

Es necesario concientizar y prepararse para que en el mediano y largo plazo se pueda dar respuesta a necesidades de disponibilidad de datos que hoy ya se pueden obtener con soluciones específicas.

¿En qué consisten las soluciones basadas en datos para el sector energético? 

En los últimos años ha surgido una creciente necesidad de un mejor entendimiento de los datos y, en el sector energético, surgió la necesidad de contar con predicciones del consumo de la energía de los diversos sistemas o redes disponibles, por ejemplo. 

¿De dónde se obtendrían los datos del consumo energético y cómo?

La fusión de las energías renovables junto con IoT (internet de las cosas) y hasta inclusive big data, abre la posibilidad de que con cualquier sistema on-grid, off-grid o híbrido, a través de un inversor estándar junto con su accesorio para la conexión WiFi (si es que no viene incluido) uno obtenga los datos disponibles para utilizar en cualquier momento.

Como un ejemplo, la marca Must que trabajamos en inversores híbridos para energía solar fotovoltaica, posee un transmisor WiFi como accesorio para cualquiera de sus equipos, que permite exportar los datos del consumo a la nube (por lo general es un servidor dedicado de la propia marca). Basta con asegurarse del correcto funcionamiento y conectividad del transmisor para que no interrumpa la transmisión de los datos generados, así se evita tener bases de datos con observaciones faltantes. 

Generación de datos de un inversor híbrido.

De manera similar, en el área de la eficiencia energética se instalan medidores de energía, que vía una conexión WiFi, pueden subir los datos a la nube o un servidor web propio de forma constante e ininterrumpida para que luego sean consumidos por el sistema de predicción.

Por último y no menos importante, las fuentes convencionales de energía también se benefician de igual forma por lo recién mencionado. Cientos de sensores IoT transmitiendo datos que se insumen en modelos predictivos le permiten a las compañías generadoras o distribuidoras de energía eléctrica, por ejemplo, aprovechar las ventajas del análisis predictivo de sus datos para el mantenimiento de equipos, proyección financiera, operaciones, etc.

¿Qué ventajas puntuales podrías mencionar? 

Las ventajas de pronosticar la demanda energética son varias y permite resolver problemas críticos de negocios. Entre los principales objetivos y beneficios se encuentran:

  • Proyección de compras de energía.
  • Planificación financiera y de inversiones.
  • Ahorro de costos en la administración y mantenimiento del sistema. Como ejemplo, una aplicación común de los pronósticos es la de “mantenimiento predictivo”: saber cuándo un sistema es probable que falle y anticipar el service.
  • Planificación de operaciones en una red eléctrica.

¿Todos los tipos de pronósticos ofrecen lo mismo? 

En general, consideramos dos tipos de previsiones de demanda de energía: a corto y largo plazo. Cada una puede tener un propósito diferente y utilizar un enfoque diferente. La principal diferencia entre los dos es el horizonte de pronóstico, es decir, el rango de tiempo en el futuro para el cual pronosticamos.

¿En el caso de hacerlo a corto plazo, hay mayores desafíos para hacerlos en 24 horas? 

En el contexto de la demanda energética, el pronóstico de la carga (consumo) a corto plazo (PCCP, Pronostico de Consumo de Corto Plazo) se define como la carga agregada que se pronostica en un futuro próximo en varias partes de la red (o la red en su conjunto). En este contexto, el corto plazo se define como un horizonte de tiempo dentro del rango de 1 hora a 24 horas.

En algunos casos, también es posible un horizonte de 48 horas. Por lo tanto, el PCCP es muy común en un caso de uso operativo de la red. Los modelos PCCP se basan principalmente en los datos de consumo del pasado cercano (último día o semana) y utilizan la temperatura pronosticada como una variable predictora importante. Obtener pronósticos de temperatura precisos para la próxima hora y hasta 24 horas se está convirtiendo en un desafío menor en la actualidad. Otra ventaja es que estos modelos son menos sensibles a los patrones estacionales o las tendencias de consumo a largo plazo.

Juan Cruz Junghanss

¿En el caso del largo plazo es todo lo contrario? 

El objetivo del pronóstico de energía a largo plazo (PCLP por Pronóstico de Consumo de Largo Plazo) es pronosticar la demanda de energía con un horizonte de tiempo que va desde una semana a varios meses (y en algunos casos podría tratarse de años, aunque no es lo usual). Este rango de horizonte es principalmente aplicable para casos de uso de planificación de recursos e inversión.

Para escenarios a largo plazo, es muy importante tener datos de alta calidad que abarquen un período de varios años (mínimo tres años). Estos modelos típicamente extraerán patrones de estacionalidad de los datos históricos y harían uso de predictores externos como patrones meteorológicos y climáticos que puedan explicar al consumo.

Es importante aclarar que cuanto más largo sea el horizonte de pronóstico, menos preciso puede ser el resultado. Por lo tanto, también es importante producir algunos intervalos de confianza junto con el pronóstico real que permitiría a las personas contemplar la posible variación en su proceso de planificación.

¿Cómo se puede modelar un sistema de predicción en esta región? 

Si bien la extensión de esta nota no alcanzaría para poder detallar cada técnica estadística de pronóstico y los detalles, podemos repasar las principales.

Como paso preliminar, los datos extraídos de la carga eléctrica de inversores, medidores, sensores u otros dispositivos, son datos de series de tiempo, en otras palabras, las observaciones están ordenadas cronológicamente y solo tienen un sentido lógico de esa forma, a diferencia de los datos que son independientes del tiempo de su medición.

¿Qué técnicas disponibles existen?

Las técnicas a utilizar y programar deben específicamente estar destinadas al menos para series de tiempo. Podemos distinguirlas entre las clásicas y las relacionadas al “aprendizaje automático” (conocido comúnmente como Machine Learning).

Por un lado, las clásicas refieren a las técnicas estadísticas tradicionales o econométricas y que inclusive algunas pueden realizarse en softwares como Microsoft Excel, entre otros. Estamos hablando de “promedios móviles” (moving average), “suavización exponencial” (exponential smoothing), “procesos autorregresivos integrados de media móvil” (ARIMA) y “métodos de regresión”.

Por otro lado, las técnicas de inteligencia computacional y Machine Learning justamente se desprenden en parte del último método mencionado: las regresiones lineales. Estas técnicas refieren a los llamados “árboles de decisión” (decision trees), “bosques aleatorios” (random forests) y “redes neuronales” artificiales (neural networks), entre otras y suelen implementarse en lenguajes de programación como Python, R, Julia, JavaScript, Scala, C++, entre los más usados.

Sin embargo, algunos de esos modelos, funcionan bien con una cantidad relativamente alta de datos, es decir, no pueden implementarse si no contamos con una base de mediciones grande. Esto por supuesto dependerá en principio del período de medición elegido (minuto, hora, día, semana, mes) y de la cantidad de mediciones (si contamos con el historial de un mes, un semestre, uno o más años). 

¿Podría citar un ejemplo? 

Sí. Veamos los resultados de un modelo de Redes Neuronales Recurrentes (RNN es el tipo de red neuronal que trabaja con datos de series de tiempo, entre otros) que predice un período futuro (t+1) del consumo de energía y para calcular la predicción toma los seis períodos inmediatamente anteriores (desde t-5 hasta t). 

Los datos empleados son del consumo (en KWh) del sistema en una hora a lo largo de tres años aproximadamente. Esto es equivalente a un promedio de alrededor de 26.000 observaciones en total, cantidad más que suficiente para poder enfocarse con tranquilidad en la precisión del pronóstico. 

Modelo de Redes Neuronales Recurrentes (RNN)

Se utilizó aproximadamente un 90% de los datos para entrenar el modelo y 10% para validar y testear los resultados. Los resultados se pueden visualizar en el gráfico a continuación que muestra la comparación entre los datos realizados realmente (azul) y lo pronosticado (rojo). Como se puede apreciar, la métrica de error resulta ser de 1,61%, lo que es totalmente aceptable y se lo puede considerar un muy buen resultado dados los objetivos del pronóstico.

El modelo implementado se construyó en lenguaje Python con las librerías/paquetes que incluyen las funciones embebidas para tal modelización. Las más usadas son Keras, Tensorflow, Scikit-learn, Statsmodels, Pandas, Numpy y Matplotlib, todos libres y de código abierto disponibles para usar gratuitamente. Asimismo, sus manuales se encuentran en las páginas oficiales. Por último, cabe mencionar que el programa construido devuelve dichos resultados una vez que fue ejecutado, pero no lo hace automáticamente sin nuestra ejecución manual. 

¿Sería posible disponer de un sistema que genere las predicciones automáticamente?

Para esto se requiere de un servicio de nube donde se pueda implementar el modelo como una aplicación o servicio web (como por ejemplo Microsoft Azure, Amazon Web Services, Google Cloud, entre otros) donde el programa pueda ser ejecutado 24/7 y haya una constante ingestión de los datos de energía del sistema a dicho programa. 

Eso más bien refiere a una solución “end-to-end” (de principio a fin) y se complejiza un poco más, ya que técnicamente la podría proveer una empresa de servicios informáticos y ciencia de datos, a menos que tengamos los recursos y conocimientos para hacerlo por nuestra cuenta. 

Solución End-To-End

¿Qué papel podrían ir adquiriendo estas soluciones?

Dada la relevancia que ha ganado la ciencia de datos en los últimos años, se puede observar que, dentro del sector energético, hay numerosos casos de uso de soluciones basadas en datos que resuelven un sinfín de problemas de negocios. Aunque a primera vista no parezca lo más sencillo de implementar, se debería incentivar al gremio a capacitarse para analizar datos o incorporar recursos que sí puedan hacerlo para ofrecerle soluciones a sus clientes. 

En la actualidad, los datos son definidos como un activo más dentro de una empresa, ya que permiten explotar patrones, anticiparse e incrementar ganancias por la mayor eficiencia en procesos o mejores resultados.