Artificial Intelligence binnen het Lab

Hoe ziet een digitale onderzoeksinfrastructuur voor kunstmatige intelligentie eruit? Dat onderzoeken we, zodat we toewerken naar nieuwe en verbeterde componenten van een digitale infrastructuur voor onderzoek.

Artificial Intelligence theme Lab

Federated learning

SURF wil de belofte van AI in veel verschillende wetenschappen helpen inlossen door individuele instellingen te ondersteunen en expertise te verzamelen in deze veelbelovende technologie. Nu staan de Nederlandse medische instellingen op het punt hun gegevens te bundelen door de invoering van federatief leren.

Wat is de huidige uitdaging die we onderzoeken?

Gegevens delen en bundelen

De kwaliteit van een model voor machinaal leren is evenredig met de hoeveelheid gegevens waarmee het wordt gevoed. Hoewel Google en Facebook over voldoende gegevens beschikken om hun modellen te voeden, zijn zij uitzonderingen in de wereld van kunstmatige intelligentie. Om zinvolle resultaten te verkrijgen, moet je vaak gegevens van veel verschillende organisaties samenvoegen. Dit is een belangrijk obstakel voor de vooruitgang van AI.

Privacykwesties en concurrentie

Een goed voorbeeld is de medische sector: als er voldoende gegevens beschikbaar zijn, kan AI veel, veel sneller antwoorden vinden op de meest uitdagende medische vragen dan we nu doen. Denk maar aan nieuwe ziekten zoals covid-19. Maar ziekenhuizen zijn verplicht de gegevens van hun patiënten geheim te houden. Afgezien van privacykwesties kan ook concurrentie organisaties ervan weerhouden hun gegevens te delen. Het resultaat is hetzelfde: modellen die niet zo nauwkeurig zijn als ze hadden kunnen zijn. En het gebrek aan samenwerking draagt ook bij tot de schaarste aan ervaren AI-ontwikkelaars.

Waar werken we aan in dit project?

Persoonlijke gezondheidstraining

De laatste jaren is een oplossing ontstaan in de vorm van federated learning. In deze aanpak 'bezoeken' AI-modellen individuele organisaties om getraind te worden op hun data. Ze fungeren dus als een vertrouwde derde partij. De Personal Health Train zal precies dat doen. Deze oplossing, die deel uitmaakt van het Nederlandse Health RI-initiatief, bestaat uit verschillende elementen. Naast het eigenlijke model, dat kan worden ontleend aan de vele bestaande AI-modellen, is er serversoftware die bij de individuele instellingen draait. De server ontvangt de 'trein' die het model draagt, past het model een beetje aan op basis van de gegevens van het instituut, en stuurt de trein - met het verbeterde model - weer op weg.

Exploratie federated learning voor onderzoek

De Personal Health Train (PHT) is ontworpen om innovators en onderzoekers in de gezondheidszorg in staat te stellen te werken met gezondheidsdata uit verschillende bronnen. De PHT kan gecontroleerde toegang geven tot data, terwijl privacybescherming en optimale betrokkenheid van individuele patiënten en burgers worden gewaarborgd. De PHT aanpak en technologie kan mogelijk ook worden toegepast in andere wetenschapsgebieden. Afhankelijk van de complexiteit van het dataverwerkingsmodel en de hoeveelheid data kan het aanzienlijke rekenkracht en expertise vergen bij de afzonderlijke instellingen om een server voor het PHT systeem op te zetten en te laten draaien. Momenteel voeren SURF en het Erasmus MC, beide betrokken bij het Health-RI initiatief, verkennende gesprekken om nieuwe concepten daartoe te ontwikkelen en te testen.

Wat is het bredere potentieel van federatief leren?

Door te helpen bij het opzetten en draaien van Personal Health Train-servers kan SURF expertise opbouwen die uiteindelijk kan worden gebruikt om verschillende wetenschappen te ondersteunen bij het bundelen van databronnen voor AI. We zien nog een andere belofte van federatief leren: het schaalt gemakkelijker, omdat computermiddelen van meerdere instellingen worden gecombineerd om grotere hoeveelheden gegevens te verwerken. En de technologie heeft ook potentieel voor het internet der dingen: in plaats van veel ruwe gegevens over zeer smalle bandbreedten te transporteren, kunnen modellen op de eindpunten worden getraind en vervolgens de resulterende parameters verzenden om te worden samengesteld.

Wat zijn de belangrijkste activiteiten?

  • Servers draaien bij SURF als nodes in de Personal Health Train
  • Opbouwen van expertise in federatief leren

Met wie werken we samen?

Erasmus MC