AAU-forskere muliggør analyse af enorme mængder vindmølledata

Moderne vindmøller er udstyret med adskillige avancerede sensorer, der konstant monitorerer møllens tilstand og performance. Disse sensorer producerer enorme mængder data, der er vanskelige at håndtere. Derfor vælger mange i dag kun at gemme f.eks. gennemsnit over intervaller af 1 eller 10 minutter. Dette giver dog usikkerhed, da eventuelle kortvarige store udsving således ikke registreres. En ny metode udviklet af forskere fra Daisy – Center for Data-Intensive Systems på AAU vil nu gøre op med dette.

Udstyr til produktion af bæredygtig energi som vindmøller og solceller er avanceret udstyr, som er dyrt, besværligt og tidskrævende at reparere. Derfor er de udstyret med en lang række avancerede sensorer med kontinuerlig strømforsyning, så fx en vindmølle er under konstant monitorering. Dette giver en enorm datamængde: op til 6.500 datastrømme og omkring 1GB data i døgnet for blot én enkelt vindmølle, så problemet bliver selvsagt kun større ved flere vindmøller.

Den enorme datamængde betyder, at det ikke er muligt at analysere og overvåge hele datamængden, og derfor aggregeres data typisk over intervaller på 1 eller 10 minutter, så man kun betragter gennemsnitsværdier af disse. Det giver dog den ulempe, at man risikerer ikke at opdage, hvis der forekommer et stort udsving ind imellem disse intervaller og derfor overser, at en mølle måske begynder at opføre sig unormalt på grund af begyndende slitage.

Modelbaseret tilgang giver optimeret overvågning

De tre forskere – professor Torben Bach Pedersen, lektor Christian Thomsen og ph.d.-studerende Søren Kejser Jensen – arbejder på at løse denne udfordring ved at gøre det muligt at gemme og bruge alt data, så man kan lave effektive forespørgsler og grundige analyser selv på de enorme datamængder fra vindmøller.

”Via vores metode vil det ofte være muligt at opdage, hvis en mølle performer dårligt, og derved lave forebyggende vedligeholdelse, så man kan sende en mand ud at se på møllen, før den for alvor går i stykker, og det bliver virkeligt dyrt at reparere den,” forklarer Christian Thomsen.

I praksis går forskernes metode ud på, at i stedet for at gemme de reelle værdier, gemmer man modeller af dataene, der fylder meget mindre, men alligevel kan genskabe tidsseriernes datapunkter.

”Vi har lavet et system kaldet ModelarDB, der benytter modeller til at repræsentere data inden for en lille fejlmargin, som brugeren selv kan vælge. Når værdierne fra sensorerne kommer ind, ser systemet på, hvilken af modellerne der kan anvendes i det givne tilfælde – eksempelvis en model for lineær stigning. Ændrer udviklingen sig, skifter systemet selv til en anden model, der passer bedre med den nye udvikling – fx en konstant kurve i stedet for den lineære udvikling,” forklarer Christian Thomsen.

Systemet har således et antal indbyggede modeltyper, men kan også udvides med flere modeltyper af brugere, der på denne måde kan udnytte deres domæneviden.

Markant nedbringelse af datamængde

Det, at man i ModelarDB anvender modeller af dataene i stedet for dataene selv, har den vigtige fordel, at man derved nedbringer mængden af information, der skal gemmes og analyseres på, markant. Forskerne har i test vist, at de ved hjælp af ModelarDB kan reducere pladsforbruget fra 783 GiB til 2,84 GiB for sensordata fra en energiproducent. Derudover kan man lave langt hurtigere forespørgsler på dataene end det er tilfældet i eksisterende systemer.

Netop nedbringelse af datamængden er også fokus i et andet aspekt af det nye system. Her arbejder forskerne på at udnytte det faktum, at tidsserier ofte korrelerer.

”Hvis man forestiller sig, at man har to vindmøller, og temperaturen ved den ene mølle er 20 grader, så kan man formode, at den også er 20 grader ved den anden. Dette er blot ét eksempel på nogle måleparametre, der vil være ens, når møllerne står i nærheden af hinanden. Derfor kan man, i stedet for at gemme to temperaturer, altså to datapunkter, blot nøjes med at gemme en – og derved får man faktisk en performance, der er flere gange bedre end ved andre systemer. Der er behov for meget mindre plads at gemme på, og det vil være meget hurtigere at lave en forespørgsel,” siger Christian Thomsen og tilføjer, at hvis værdierne adskiller sig, og den ene mølle er varmere end den i nærheden, gemmes data fra begge møller naturligvis.

Positiv feedback fra industrien

Skønt værktøjet endnu ikke er færdigudviklet, tyder de foreløbige resultater på, at det vil kunne blive et overordentligt værdifuldt værktøj i industrien.

”Vi har indtil nu testet systemet med vindmølledata fra pålidelige sensorer, samt med energidata, og i begge tilfælde viser det virkeligt flotte resultater. Vi formoder derfor, at ModelarDB vil kunne anvendes i andre lignende datamiljøer også. Alt i alt får vi nogle datamængder, der gør det nemmere at lagre dataene, nemmere at analysere på dem og lettere og ikke mindst hurtigere at opdage kritiske udsving i dem, og det vil kunne udnyttes i en lang række forskellige brancher,” siger Christian Thomsen.

Værktøjet har været fremvist for vindmølleindustrien, som ser stort potentiale i at bruge teknikkerne.

”Både mølleejere og mølleproducenter opsamler enorme mængder data, og ved at generere mere højfrekvent data, kan de opdage fejl og problemer meget tidligere – fx på grund af maling, der skaller, eller et slidt tandhjul. Derved kan de bruge deres data proaktivt og sætte ind med vedligeholdelse, før det bliver rigtig dyrt,” afslutter han.

Christian Thomsen, lektor, Institut for Datalogi, Aalborg Universitet

Torben Bach Pedersen, professor, Institut for Datalogi, Aalborg Universitet

Søren Kejser Jensen, ph.d.-studerende, Institut for Datalogi, Aalborg Universitet