Best practice: statistische analyses met Lisa voor inzicht in ziektes

Kennis over de relatie tussen genetische varianten en psychiatrische aandoeningen neemt snel toe. Met duizenden varianten die betrokken kunnen zijn bij 1 enkele aandoening blijkt die relatie echter veel complexer te zijn dan tot voor kort werd aangenomen. Computationele analyse helpt genetici bij het doen van onderzoek.

Kabels uit supercomputer

Genetisch onderzoek

Met behulp van computationele analyse vergroten genetici hun inzicht in het relatieve belang van genetische varianten. Het onderzoeksteam van prof. dr. Danielle Posthuma, hoogleraar psychiatrische genetica aan de Vrije Universiteit Amsterdam (VU), maakt daarbij intensief gebruik van het rekencluster Lisa bij SURFsara. “Sinds een paar jaar weten we dat psychiatrische ziektes door heel veel varianten worden veroorzaakt”, zegt Posthuma. “Vroeger dachten we dat 1 gen verantwoordelijk was voor depressie, maar nu weten we dat het er minstens duizend zijn, misschien wel achtduizend. Dat geldt voor alle aandoeningen die we onderzocht hebben, zoals depressie, schizofrenie, autisme en ADHD. Maar dat betekent ook dat elke individuele variant maar een klein effect heeft. Iemand met een depressie heeft ook niet alle genvarianten die we associëren met depressie, maar misschien een paar honderd. Dat maakt het lastig om alle relevante genen in kaart te brengen.”

“Vroeger dachten we dat 1 gen verantwoordelijk was voor depressie, maar nu weten we dat het er minstens duizend zijn, misschien wel achtduizend.”
Prof. dr. Danielle Posthuma, hoogleraar psychiatrische genetica aan de Vrije Universiteit Amsterdam

Omvangrijke datasets

Voor het onderzoek werken de VU-onderzoekers samen in internationale consortia. Binnen die consortia worden omvangrijke datasets gedeeld, aldus Posthuma: “Onze grootste dataset is die voor schizofrenie, waarin gegevens van 70.000 patiënten en 110.000 controles (gezonde personen) zijn opgenomen. Van elke controle hebben we één miljoen genetische varianten gemeten. Voor de analyse hebben dan ook veel rekencapaciteit nodig. Bij SURFsara gebruiken we het rekencluster Lisa voor statistische analyses: we kijken per gemeten variant of die vaker in patiënten voorkomt dan in controles. Daarnaast doen we op Lisa ook geavanceerdere analyses, bijvoorbeeld naar de interactie tussen verschillende genetische varianten en naar het effect van meerdere varianten uit hetzelfde biologische pathway.”

“Onze behoefte aan rekenkracht is steeds groter geworden. Onze investeringen in Lisa zijn nodig om de omvangrijke datasets in het geheugen te kunnen laden en te analyseren.”
Prof. dr. Danielle Posthuma, hoogleraar psychiatrische genetica aan de Vrije Universiteit Amsterdam

Uitbreiding van Lisa

De samenwerking met SURFsara is intensief, stelt Posthuma: “In 2006 zijn we begonnen met rekenen op projectbasis. Maar onze behoefte aan rekenkracht werd al snel groter. Op een gegeven moment hebben we met subsidie van NWO een uitbreiding op het Lisa-cluster kunnen financieren. Sindsdien werken we structureel met SURFsara samen. Maar we groeien qua capaciteit uit ons jasje, de schaal waarop we onze analyses doen groeit sneller dan de infrastructuur. We breiden Lisa verder uit, we hebben inmiddels zelf een TeraByte-server aangekocht en zijn bezig met het aankopen van een high memory node. Onze investeringen in Lisa zijn nodig om de omvangrijke datasets in het geheugen te kunnen laden en te analyseren.”

Van statistiek tot therapie

Begin 2014 hebben de onderzoekers bij de VU opnieuw een forse subsidie van NWO ontvangen. “Ook in 2014 gaan we weer veel rekenen op Lisa”, zegt Posthuma. “Een van de doelen is nieuwe methodes te ontwikkelen om meer inzicht te krijgen in het relatieve belang van de duizenden genetische varianten die bij een psychiatrische aandoening betrokken zijn. Als we weten welke genen betrokken zijn bij een aandoening, weten we nog niet hoe dat werkt. Dat is de volgende uitdaging: we moeten de stap maken van een statistisch verband naar een causaal verband."