Use case: Wetenschap profiteert van gametechnologie

Grafische processoren worden steeds belangrijker in de wetenschap: deze GPU’s kunnen de doorlooptijd van een onderzoek soms spectaculair verkorten. Rekencluster Lisa van SURF is dit voorjaar uitgebreid met GPU’s, die onder andere worden gebruikt voor machine learning.

Uitzaaiingen (metastase) - data afkomstig uit het onderzoek van Bas Veeling

Er bestaat geen kritischer publiek dan gamers. Steeds zijn ze op zoek naar nieuwe hardware die de wereld van hun computerspellen nóg levensechter op het scherm kan toveren. Het magische ingrediënt is de ‘graphics processing unit’ ofwel GPU. Deze processor heeft slechts één taak: hij voert de berekeningen uit die nodig zijn voor razendsnel bewegend beeld, in hoge resolutie, met realistische lichteffecten en steeds vaker ook in 3D.

Een jaar of vijftien geleden raakten wetenschappers geïnteresseerd in deze GPU’s. Niet alleen voor visualisatie van data, maar ook voor bepaalde andere rekentaken bleken ze bijzonder geschikt, vertelt Caspar van Leeuwen, adviseur bij SURF. “Een GPU heeft veel meer rekenkernen dan een CPU (centrale processor die verantwoordelijk is voor de berekeningen en aansturingen in een computer). Daardoor kan hij duizenden taken tegelijk uitvoeren. Dat moeten wel grotendeels identieke taken zijn, want de GPU-rekenkernen zijn geclusterd in groepen die elk één instructie-unit moeten delen en dus steeds dezelfde taak uitvoeren: óf allemaal optellen, óf allemaal vermenigvuldigen, et cetera.”

"Op een goede CPU-computer duurt het trainen van mijn model misschien een maand of 2. Met het GPU-cluster van Lisa ben ik in een uurtje klaar."

Vaak bleek het mogelijk om software te versnellen door bepaalde deeltaken aan GPU’s toe te wijzen. Daar heeft bijvoorbeeld de moleculaire dynamica van geprofiteerd. Het is dus geen wonder dat de negen snelste supercomputers op aarde allemaal naast hun CPU’s ook GPU’s bevatten.

Supersnel

Ook bij SURF worden GPU’s steeds vaker ingezet. Je vindt ze in de nationale supercomputer Cartesius, en nu ook in het rekencluster Lisa. Daar zit wel verschil tussen, zo legt Van Leeuwen uit. “De GPU’s op Cartesius zijn speciaal ontwikkeld voor professioneel gebruik. Ze kunnen gemakkelijker rekenen met hogeprecisiegetallen: getallen met veel cijfers achter de komma. Daarnaast kunnen de professionele GPU’s snel onderling data uitwisselen. Dat is handig voor grote, complexe modellen, waarbij de GPU’s samen aan dezelfde berekening werken.”

Het nieuwe GPU-cluster op Lisa bevat GPU’s die voor gamers gemaakt zijn. Deze zijn vooral supersnel: het cluster haalt een top van 1 petaflop/s. Dat zijn 1.000.000.000.000.000 bewerkingen per seconde. Van Leeuwen concludeert: “De systemen vullen elkaar goed aan.” Voor beide geldt dat steeds meer onderzoekers ze gebruiken voor een nieuwe toepassing van GPU’s: machine learning, ofwel het trainen van computermodellen om intelligente taken uit te voeren.

Tumorweefsel herkennen

Bas Veeling is een van deze gebruikers. Als promovendus bij de UvA onderzoekt hij onder meer hoe de computer kan helpen bij medische diagnoses. Hij legt uit: “Om tumorweefsel te zien in een lymfeklier wordt een biopt afgenomen en onder een digitale microscoop gelegd. Dan krijg je een gigantisch grote scan voor je neus: zo’n 200.000 bij 100.000 pixels. Voor een patholoog is het zoeken naar een naald in een hooiberg.”

De oplossing is computers te trainen in het herkennen van tumorweefsel. Dat kan dankzij GPU’s. Veeling: “De huidige groeispurt van machine learning ontstond rond 2009, toen onderzoekers modellen ging implementeren op GPU’s. Daarna is het hard gegaan. Modellen die zijn ontwikkeld om alledaagse objecten te herkennen op foto’s, blijken ook een goede basis voor medische toepassingen. Een paar
jaar geleden konden ze tumorweefsel al beter herkennen dan een groep pathologen die er onder realistische omstandigheden naar keek. Dus de computer kan pathologen helpen om betere diagnoses te stellen.”

Veeling onderzoekt hoe dit soort modellen accurater gemaakt kunnen worden. Door het GPU-cluster op Lisa te gebruiken, wist hij in één maand 2 papers af te leveren. “Op een goede CPU-computer duurt het trainen van mijn model misschien een maand of 2. Met het GPU-cluster van Lisa ben ik in een uurtje klaar.”

Aardbevingen

Naast machine learning profiteert ook het ‘traditionele’ rekenen van de GPU’s bij SURF. Pinaki Kumar (TU Eindhoven) gebruikt Cartesius voor zijn onderzoek naar zachtglazige stoffen. Denk daarbij aan mayonaise – een mengsel van water en olie – maar ook aan de ondergrond van Groningen, waarvan de stabiliteit nu verstoord wordt door de gaswinning. Kumars computermodel kan gebruikt worden om de optimale verhoudingen van vloeistoffen in mengsels te vinden, maar als eerste onderzoeker heeft hij er ook aardbevingen mee kunnen simuleren.

Dit was onmogelijk geweest zonder GPU’s, zo vertelt hij: “Doordat die beschikken over talloze rekenkernen, kon ik het model ‘massaal parallel’ maken. Het draait op één GPU van SURF net zo snel als op 8 van de nieuwste CPU’s.”

Een tweede voordeel is de schaalbaarheid. “Ik ontwikkel en test mijn model op een bureaucomputer met een flinke GPU. Als ik het vervolgens bij SURF laat draaien, kan ik heel gemakkelijk net zoveel GPU’s aankoppelen als nodig is: de snelheid van de simulatie groeit lineair mee. Met CPU’s kun je dat vergeten.”

Dit artikel verscheen eerder in SURF Magazine 2018/02 https://www.surf.nl/kennisbank/2018/surf-magazine-02-juni-2018.html 

Afbeelding: Uitzaaiingen (metastase) - data afkomstig uit het onderzoek van Bas Veeling