Hoe maak je internet-of-thingsdata veilig en efficiënt beschikbaar?

Via het internet of things (IoT) kun je interessante gegevens verzamelen. Om onderzoek mee te doen, of om inzicht te krijgen in drukte op de campus. Hoe kunnen onderwijs- en onderzoeksinstellingen dit soort data efficiënt en veilig verzamelen en beschikbaar maken?

Collegezaal met studenten

Samen met die instellingen ontwikkelt SURF daar diverse diensten voor. Lolke Boonstra (TU Delft) en Jeroen van Ingen Schenau (Universiteit Twente) maken hier al gebruik van. “Dit soort IoT-diensten zijn waardevol voor het hele onderwijs en onderzoek.” 

Verkeersstromen op de campus monitoren 

Op de TU Delft zien ze de laatste jaren dat steeds meer onderzoekers geïnteresseerd zijn in wifi-data, bijvoorbeeld welke IP-adressen wanneer met welk access point in het netwerk verbonden zijn (geweest). Heel interessante gegevens, want je kunt er veel uit aflezen over de bezetting en benutting van gebouwen, maar ook over verkeersstromen van mensen over de campus. 

Lolke Boonstra

“Sinds covid-19 en de bijbehorende maatregelen krijgen we alleen maar meer aanvragen: met gegevens van het wifi-netwerk kun je onder andere goed monitoren of de maximale gebouwbezetting overschreden wordt”, aldus Lolke Boonstra. Hij is ict-research-expert bij de TU Delft en houdt zich bezig met ict-ondersteuning voor onderzoekers. “We waren al een paar jaar bezig met de vraag hoe we wifi-data goed beschikbaar kunnen stellen aan onderzoekers. Onderzoekers kunnen wel elke keer een aanvraag doen bij IT-beheer, maar dat kost zowel de onderzoeker als de IT-beheerder veel tijd en inspanning. En er kan veel misgaan, bijvoorbeeld als het gaat om privacyborging.” 

Datastreamingplatform 

Lolke en zijn collega’s zijn gaan nadenken hoe onderzoekers op een gestandaardiseerde manier toegang kunnen krijgen tot wifi-data. Daarvoor was een datastreamingplatform nodig. Een datastreamingplatform bestaat in de kern uit een server of een aantal servers die real-time data ontvangen van bronsystemen (bijvoorbeeld sensoren). Dit gebeurt onder andere via API’s. Onderzoekers kunnen inloggen op het platform en afhankelijk van hun rechten, data uit het systeem downloaden en gebruiken. Op het platform kunnen ook andere diensten aangesloten zijn, bijvoorbeeld voor het maken van 3D-visualisaties of overzichten (dashboards). 

“Als je data verwerkt, krijg je al snel te maken met de AVG.”
Lolke Boonstra, TU Delft

De TU Delft heeft samen met SURF het TU Delft Data Platform voor Onderzoekers ontwikkeld. Lolke: “We zijn begonnen met het inhuren van consultancy om dit platform te programmeren, in eerste instantie met de sensordata van het Green Village fieldlab op de campus. SURF heeft bijvoorbeeld een Kubernetes-cluster ingericht waarop de Kafka-software draait, de software voor het streamen van data. Vervolgens hebben we het platform samen verder uitgebouwd en doorontwikkeld. Inmiddels draait het platform overigens in de publieke cloud, en dat is ook hoe SURF de dienst straks aan gaat bieden. Het voordeel van de cloud is onder andere dat we de dienstverlening die we afnemen bij SURF, makkelijker kunnen uitbreiden met extra functionaliteit. Deze extra functionaliteit wordt ook gebruikt voor de data van de Green Village.” 

Persoonsgegevens 

Er zitten niet alleen technische aspecten aan het bouwen van een datastreamingplatform. “Als je data verwerkt, krijg je al snel te maken met de AVG”, aldus Lolke. “In het geval van wifi verwerk je bijvoorbeeld IP-adressen en dat zijn persoonsgegevens. Het is voor een onderzoeker niet gemakkelijk om aan de AVG te voldoen. Om diens taak te verlichten, regelen we de privacyborging deels in het datastreamingplatform: we pseudonimiseren bijvoorbeeld de MAC- en IP-adressen van devices die gebruikmaken van het wifi-netwerk. 

In hun datamanagementplan moeten onderzoekers nog wel aangeven welke data ze voor welk doel willen gebruiken, en hoe lang ze de data willen opslaan. Maar een groot deel van de verantwoording voor de AVG gebeurt in het dataplatform, en trouwens ook in de systemen die de data aanleveren aan het platform. Zo is het gebruik van de data ook makkelijker te verantwoorden naar juristen, dat is een groot voordeel van deze werkwijze.” 

De campus van TU Delft

De campus van TU Delft

Goede samenwerking 

Jeroen van Ingen Schenau

Ook de Universiteit Twente maakt gebruik van de IoT-dienstverlening van SURF. Ze hebben daar zelf al een datastreamingplatform draaien, maar gebruiken de SURF LoRa network server, op basis van open source software van Chirpstack. Jeroen van Ingen Schenau is netwerkbeheerder bij de UT en houdt zich bezig met IoT-projecten. “We hebben op de campus een aantal zogenaamde LoRaWAN-gateways draaien. Dat zijn ontvangers die via een speciaal draadloos protocol data doorgestuurd krijgen van sensoren overal op de campus. Bijvoorbeeld aanwezigheidsmelders in ruimtes, temperatuursensoren, parkeersensoren enzovoort. Die gateways sturen de ontvangen data door naar de network server. Vandaaruit gaan de data naar het dataplatform om verwerkt te worden.” 

"We hebben ook enige invloed op de ontwikkeling van nieuwe features."
Jeroen van Ingen Schenau, Universiteit Twente

De UT heeft gebruikt al een network server op basis van The Things Network. Dit netwerk heeft een grote dekking, en wordt vooral gebruikt door onderzoekers. Maar voor de businessdata (de data afkomstig van de eerdergenoemde sensoren op de campus) zocht de UT een zeer bedrijfszekere netwerkserver. De LoRa network server bleek precies wat ze zochten. Jeroen: “Deze server wordt door SURF zelf gehost en beheerd. En doordat we direct contact hebben met SURF, hebben we ook enige invloed op de ontwikkeling van nieuwe features. De samenwerking verloopt goed en het schept vertrouwen dat SURF weer direct contact heeft met de ontwikkelaars van Chirpstack.” 

Veel belangstelling 

In Delft draait het dataplatform inmiddels. Lolke: “De belangstelling is groot. We krijgen aanvragen van masterstudenten maar ook van grote onderzoeksprojecten. Een ander mooi voorbeeld is het onderzoek naar machine learning van mijn collega Susan Branchett. Het dataplatform is overigens nog niet officieel in productie, maar dat is een kwestie van tijd. We zijn nu nog veel bezig met datawrangling: het gereedmaken van ruwe data voor inlezen in het dataplatform, en zorgen dat data voortaan gestandaardiseerd aangeleverd wordt. Dat kost ons nu 1 keer tijd, maar scheelt onderzoekers straks veel tijd.” 

Meer plannen met het dataplatform 

De TU Delft en de UT gebruiken de IoT-dienstverlening van SURF dus al, maar officiële diensten zijn het nog niet. Daar wordt aan gewerkt. Lolke: “Samen met SURF hebben we dit mooie dataplatform ontwikkeld, en we zien dat ook andere instellingen daar veel aan kunnen hebben. Een standaardoplossing scheelt andere universiteiten straks veel uitzoek- en ontwikkelwerk. En zelf hebben we ook nog veel plannen met dit dataplatform. Het beleid van TU Delft is namelijk dat de campus zelf een onderzoeksobject is, waaraan je zoveel mogelijk wilt kunnen meten en onderzoeken. Denk bijvoorbeeld aan energieverbruiksdata. Die zijn zeer interessant voor onderzoekers in verband met de aanstaande energietransitie. We zijn bijvoorbeeld het project Brains 4 Buildings gestart, in samenwerking met de TU Eindhoven.” 

Ook Jeroen vindt het fijn als SURF de IoT-diensten straks structureel aanbiedt. “We gebruiken de SURF LoRa network server nu voor het verwerken van data uit een aantal bedrijfskritische processen. Het is dus mooi om straks de zekerheid te hebben dat we de dienst voor langere tijd kunnen afnemen bij SURF."

Tekst: Jan Michielsen