Eindeloze hoeveelheden data komen tegenwoordig beschikbaar. Maar hoe kun je ze veilig en vertrouwd verwerken, analyseren en (her)gebruiken? De projecten in dit Labs-thema onderzoeken deze aspecten.
eTEC-BIG Advanced data management
Het verkrijgen van data wordt steeds goedkoper, waardoor datasets explosief groeien. Om te zorgen dat plantgenoom-analyses ook met grote datasets mogelijk blijven, werkt SURF samen met de WUR en eScience Center aan een schaalbare oplossing voor de bioinformatica-applicatie PanTools.
Waarom doen we dit project?
In de plantenwetenschappen bestuderen onderzoekers hoe planten beter veredeld kunnen worden. Ze gebruiken hiervoor genetische data. Het wordt steeds goedkoper om deze data te verkrijgen, waardoor datasets alsmaar groter worden. Waar in het verleden onderzoekers aan de slag gingen met een dataset van een handvol sla-genomen, werken ze nu met een dataset van maar liefst honderd genomen. Samen met de WUR en het eScience Center optimaliseert SURF de bioinformatica-applicatie PanTools om de explosieve groei van data te kunnen bijbenen. En er zo voor te zorgen dat plantenonderzoekers de data effectiever kunnen analyseren.
Wat zijn de belangrijkste activiteiten?
SURF ontwerpt een schaalbare oplossing voor PanTools, die zorgt dat PanTools steeds grotere datasets kan analyseren. We doen dit in samenwerking met de wetenschappers van de WUR en engineers van het eScience Center. SURF verkent en adviseert over Big Data-technieken en databases, en levert infrastructuur voor het ontwikkelen en testen van schaalbare analyses. Als laatste adviseert SURF over het verbeteren van ontwikkelmethoden om uiteindelijk een hoogwaardige en schaalbare applicatie te kunnen leveren aan onderzoekers.
Met wie werken we samen?
We werken in dit project samen met de WUR en eScience Center.