Samenwerkings-hub voor Alzheimeronderzoek: “We zijn aan het pionieren”

Nederlandse DNA-data beschikbaar maken voor onderzoekers uit andere landen, zodat we het onderzoek naar Alzheimer kunnen versnellen? De strenge Europese privacywetgeving maakt dat behoorlijk lastig. Biochemicus Henne Holstege werkt (samen met bio-informaticus en collega Marc Hulsman) en SURF aan een platform dat dit tóch mogelijk moet maken.

Henne Holstege met plakjes hersenen tussen glasplaten in een ziekenhuissetting

Tijdens haar promotieonderzoek naar borstkanker was Henne Holstege aanvankelijk van plan om zich te specialiseren in genetisch onderzoek van tumoren. Maar dan overlijdt in 2005 Hendrikje van Andel-Schipper, de oudste persoon ter wereld. “Zij was 115 jaar en nog razor sharp. Dat vond ik eigenlijk veel gaver. Zij toonde in haar eentje aan dat niet iedereen aftakelt. Het menselijk brein kan heel lang gezond blijven. Ik wilde weten hoe dát kan. Toen heb ik eerst het genoom van mevrouw Van Andel-Schipper helemaal uitgeplozen. Maar je hebt natuurlijk veel meer proefpersonen nodig.”

Daarom zette Holstege haar inmiddels bekende 100-plusonderzoek op aan het Amsterdam UMC. Ze onderzoekt binnen dit project niet waarom mensen Alzheimer krijgen, maar juist waarom gezonde mensen géén Alzheimer krijgen. Hiervoor bestudeert ze onder andere DNA van deze ouderen, om te kijken met welk genetisch materiaal zij worden geboren. “Daarnaast vragen we 100-plussers die meedoen met ons onderzoek of ze na hun overlijden hun hersenen willen doneren. Dan kunnen we kijken hoe een heel oud, maar goed functionerend brein er nu eigenlijk van binnen uitziet. Daar leren we ontzettend veel van!”

Samen met SURF werkt jouw onderzoeksgroep nu aan een platform waarop onderzoekers uit verschillende landen hun data kunnen uploaden en analyseren. Waarom is dit nodig?

“Bij dit project willen we juist weten welke genetische varianten een rol spelen bij de ziekte van Alzheimer. Het is nog toekomstmuziek, maar het idee is dat we met de gevonden genetische varianten straks kunnen voorspellen wie op latere leeftijd dement wordt en wie niet. Zodat we tijdig weten wie we moeten behandelen, vóórdat er klinische symptomen ontstaan. Want dan is het te laat: die hersencellen raak je kwijt en krijg je met geen enkel medicijn weer terug. Omdat het erfelijk materiaal zo ongelooflijk complex is, moet je hele grote groepen Alzheimerpatiënten en hele grote controlegroepen met elkaar vergelijken. En omdat het vaak over zeldzame varianten gaat, moet je genoeg bewijs hebben om vast te stellen dat een bepaalde erfelijke variant leidt tot een verhoogd risico om de ziekte te krijgen."

“Het delen van genetische data is ontzettend lastig, vanwege de strenge regels van de AVG”

“Dat betekent dat je moet samenwerken met zoveel mogelijk onderzoekers, liefst wereldwijd, om zoveel mogelijk data te krijgen. Dat is lastig, want zodra wij in iemands dataset mogen kijken, moeten die data naar ons toekomen, en moet je aan de Algemene verordening gegevensbescherming (AVG) voldoen. Genetisch materiaal valt in de categorie ‘bijzondere persoonsgegevens’ en is daarmee extra beschermd. Genetisch onderzoek is op het moment dus ontzettend lastig, omdat je deze data niet makkelijk kan delen. Terwijl al die Alzheimerpatiënten hun DNA hebben afgestaan met het idee: daar kunnen we van leren.

In de VS staan ze er anders in. Alles wat het federale National Institutes of Health (NIH) betaalt aan het verkrijgen van data, moet publiekelijk worden gedeeld. Wij kunnen die data uit Amerika dus gewoon downloaden. Vervolgens kunnen wij ze samenvoegen met onze data en die van andere Europese onderzoekers.

Maar als ze op ons account op de supercomputer staan, kunnen alleen wij bij deze grote dataset. Daar voelde ik me ongemakkelijk bij. Om dit probleem op te lossen, ontwikkelen we een platform dat draait bij SURF: de Alzheimer Genetics Hub. Hier zetten we de data op en maken ze beschikbaar, zodat de Amerikaanse en Europese onderzoekspartners er ook bij kunnen. Daar hebben we toch allemaal profijt van?”

Henne Holstege met plakjes hersenen tussen glasplaten in een ziekenhuissetting

Henne Holstege

Hoe weet je zeker dat de persoonsgegevens veilig blijven?

“Iedereen die van ons toegang krijgt, kan zijn berekeningen op het platform doen. Daardoor is er ook geen noodzaak om de datasets te downloaden. Bovendien zit er een limiet aan de hoeveelheid data die je kunt downloaden, waardoor je geen hele genomen kunt downloaden. Maar wel de uiteindelijke resultaten van je analyse, want daar wil je over publiceren. We houden ook bij wat er wordt gedownload en door wie.

De data die er door anderen op worden gezet, zijn niet van ons. Wij kunnen geen toegang bieden tot deze datasets, daar moeten de dataeigenaren zelf toestemming voor geven. Om toegang te krijen, moet je allerlei juridische formulieren en contracten tekenen. Persoonsgegevens blijven dus veilig op het platform. Maar het gaat ook om vertrouwen. Dat mag je nooit schaden.”

Wat zijn jouw verwachtingen van de samenwerkingen die gaan plaatsvinden?

“Ik hoop dat als we laten zien dat we écht gaan delen, veel meer onderzoekers hun data op de hub zetten. En dat de beste bio-informatici ter wereld denken: yes, eindelijk kan ik bij die data! Die gaan ermee aan de slag, waardoor we een heleboel nieuwe bevindingen kunnen doen. We hebben wel bepaalde vermoedens, maar we hebben nog veel meer Alzheimerpatiënten en controle-DNA nodig om die te bevestigen. De technologie gaat hard, we kunnen zo veel meer dan 5 jaar geleden. Ik heb goede hoop dat behandelingen op een gegeven moment mogelijk zijn."

“Hiermee hopen we het veld van Alzheimeronderzoek echt een boost te geven”

In de beginfase wil Holstege toegang tot de hub gratis aanbieden aan de vakgenoten die hun data delen. “Dat kan omdat we van NWO een grote grant hebben gekregen voor rekentijd en opslag. We zijn heel erg aan het pionieren hier. Ik moet eerlijk bekennen dat ik af en toe denk: waar zijn we aan begonnen? Alle energie die we erin stoppen, kunnen we niet ook nog in andere papers stoppen, bijvoorbeeld voor het 100-plusonderzoek. Dat is wel eens lastig, want je wordt als wetenschapper toch afgerekend op je output. Maar ik heb het gevoel dat we het Alzheimeronderzoek hiermee echt een boost geven.”

Spidertechnologie: spin in het web  

“Toen ik het voor het eerst over dit project hoorde, dacht ik: met alleen technologie kan dit niet. Iemand interactieve toegang geven tot data, zonder dat hij die kan opslaan”, zegt Coen Schrijvers, senior adviseur en teamlead bij SURF. “Een van de grootste uitdagingen is dus om een oplossing te ontwikkelen die in technisch en juridisch opzicht een naadloze eenheid vormt.”

De cloudgebaseerde Spidertechnologie, die SURF nog maar relatief kort in huis heeft, bleek de ideale oplossing. “Hiermee kunnen we een maatwerkomgeving ontwerpen die volledig is toegespitst op de eisen van dit project: een veilige maar tegelijk flexibele omgeving voor samenwerking op grote datasets.”

De designfilosofie van Spidertechnologie is dat het computercluster als een spin in het web leeft: benodigde componenten die je ergens anders al kunt vinden, hoef je niet opnieuw te bouwen. Schrijvers: “Je koppelt het gewoon aan bestaande diensten, zoals supercomputer Snellius, onze Grid-opslag of Research Drive.”

Firewall en diverse rollen

De Alzheimer Genetics Hub staat achter een firewall, met daarnaast enkele speciaal ingerichte services om het inloggen, selectieve filetransfers en intensieve logging (vastleggen wat er gebeurt) mogelijk te maken. De technologie biedt verschillende autorisatie- en authenticatierollen, zoals een datamanager die alle rechten heeft op de data, en een gewoon lid dat alleen toegang krijgt tot bepaalde data. “Dat past heel goed bij dit project”, vindt Schrijvers. “We zetten daarbij ook de dienst SURF Research Access Management in, waarmee de groep van Holstege de authenticiteit van gebruikers kan verifiëren en hen zelfstandig kan toevoegen en verwijderen.”

In een proof of concept, gepland voor december 2021, moet blijken of het Alzheimerplatform ook praktisch gaat werken. “Als alles goed gaat, kunnen we vervolgens binnen een paar maanden in productie. Het project moet meerdere jaren gaan lopen. En wordt hopelijk een mooi voorbeeld voor vergelijkbare projecten.”

Off-the-shelf Spiderdienst

De Alzheimer Genetics Hub is maatwerk. Daarnaast biedt SURF ook een generieke Spiderdienst, een dynamisch en flexibel platform geschikt voor grootschalige dataverwerking en optimalisaties voor datacentrische samenwerking. Hierop zijn projecten actief waarvoor geen aparte omgeving vereist is. Net als bij de Alzheimer Genetics Hub hebben deze gebruikers toegang tot krachtige systemen voor dataverwerking en -opslag en een netwerkconnectiviteit tot andere SURF-diensten van 1,2 Terabit per seconde.

“Maar het belangrijkste is de ondersteuning die we bieden bij het inrichten en automatiseren van datacentrische projecten. Dat wil bijvoorbeeld zeggen dat meerdere mensen kunnen werken aan één dataset, waarbij een datamanager rechten op projectdata toekent en een softwaremanager de tools voor analyse beheert. Het is daarmee een redelijk laagdrempelige dienst, zonder in te boeten aan dataverwerkingsvermogen.”

Tekst: Josje Spinhoven