Research Data Zone
SURF onderzoekt de mogelijkheden van een research data zone. Dit is een deel van het campusnetwerk dat is geoptimaliseerd voor data-intensief onderzoek. Samen met de UvA/HvA is een project gestart om dit te ontwerpen en implementeren. SURF heeft een coördinerende rol in het samenbrengen van de partijen.
Meer data-intensief onderzoek
Onderzoek wordt steeds data-intensiever en vraagt in toenemende mate om een snelle uitwisseling van grote volumes onderzoeksdata. Het verwerken, verplaatsen of delen van grote datasets kost nu vaak nog veel tijd voor een onderzoeker. De reden hiervan is dat het campusnetwerk is geoptimaliseerd voor algemeen gebruik (zoals email, web browsing, digitale leeromgeving, personeelsadministratie) en doorgaans niet voor data-intensief onderzoek.
Wat is een research data zone?
Een research data zone omvat een deel van het campusnetwerk dat speciaal ontworpen is voor high-performance onderzoekstoepassingen. Netwerkapparatuur, configuraties en informatiebeveiligingsmaatregelen zijn zo ingericht dat een onderzoeker makkelijk grote volumes onderzoeksdata kan delen en verplaatsen, op afstand experimenten kan beheren of data kan visualiseren. Ook het delen van vertrouwelijke of gevoelige data kan eenvoudiger op grotere schaal gebeuren via een research data zone. Een research data zone communiceert met een soortgelijke research data zone op een andere locatie. Dus aan beide kanten van verbinding moet de netwerkinfrastructuur goed zijn ingericht.
Projectfases
Samen met de UvA/HvA is SURF een project gestart om een research data zone te ontwerpen en te implementeren in de campusnetwerkinfrastructuur. Het project omvat een aantal fases:
- Opstellen van requirements op basis van interviews met onderzoekers
- Ontwerpen van de architectuur: welke componenten en technologieën worden ingezet?
- Implementatie van de architectuur van de research data zone aan de hand van use cases
- Evaluatie van de use cases
- Disseminatie van de research data zone naar andere instellingen
Testen met use cases
De geschiktheid van de research data zone wordt getest in een aantal use cases. Zo gaan onderzoekers van de UvA samenwerken aan genoomdata van planten met een een high-tech plantveredelingsbedrijf. Alle partijen moeten toegang kunnen hebben tot de verwerkte data. Het gaat om een aantal terabytes aan data per genoom.
Generieke oplossing
De architectuur voor de research data zone wordt zo generiek gemaakt dat andere instellingen het ontwerp van de research data zone eenvoudig kunnen implementeren in hun eigen campusnetwerk. Zo kan een onderzoeker grote of vertrouwelijke datasets op een snellere en makkelijkere manier transporteren andere locaties.
Rol van SURF
Een research data zone werkt alleen goed als aan beide kanten van de verbinding de netwerkinfrastructuur optimaal is ingericht en op elkaar is afgestemd. SURF heeft een coördinerende rol in het samenbrengen van de partijen. Daarnaast stelt SURF kennis beschikbaar over netwerken.
Meer informatie
- De research data zone is afgeleid van een Science DMZ. Lees meer over Science DMZ bij ESnet.
- Lees meer over E-LAN een virtueel privaat netwerk tussen verschillende UMC’s om vertrouwelijke onderzoeksdata uit te wisselen.
- Maarten Noom (m.j.m.noom@hva.nl) is projectleider van de Research Data Zone bij de UvA/HvA.