Training

Introductie Supercomputing, deel II

Als je veel berekeningen moet uitvoeren, of analyses die te groot zijn voor je eigen systeem, bieden clusters en supercomputers de rekenkracht die je nodig hebt. In deze cursus leer je werken met de nationale supercomputer Snellius.

Snellius
15 apr 2024
Tijd
9:00 tot 14:00
Plaats
Neuron 0.262, TU/e Campus, Eindhoven

Wat leer je in deze cursus?

Deze cursus is een vervolg op de eerste inleidende cursus Supercomputing, waarin je een diepere duik kunt nemen in het gebruik van supercomputers met speciale aandacht voor efficiëntie en goede praktijken en een zeer praktische aanpak.

Het format van deze cursus omvat de volgende modules:

  • Grondbeginselen van prestatieanalyse. Deze inleidende technische presentatie introduceert hybride systemen met hoge prestaties en behandelt op abstracte wijze de architectuur en configuratie van het systeem. Ons doel is om het begrip van HPC-complexiteit te vergroten voordat we dieper ingaan op het belang van prestatieanalysemodellen. Speciale aandacht wordt besteed aan het Roofline-model.
    • Abstract Modelleren van hybride supercomputers. Presentatie van een abstracte modelbenadering voor hybride supercomputers, waarbij hun complexiteit wordt samengevat in drie belangrijke parameters: piekprestaties, geheugen en netwerkbandbreedte.
    • Prestatieanalyse. Prestatieanalyse verkennen, te beginnen met een overzicht van verschillende modellen en dieper ingaan op de specifieke kenmerken van het daklijnmodel.
    • Het daklijnmodel. Het daklijnmodel beschrijven en de praktische toepassing ervan presenteren aan de hand van duidelijke uitleg en demonstraties.
  • Bestandssystemen. Deze praktische sessie behandelt het juiste gebruik van bestandssystemen op HPC-systemen, vooral op Snellius.
  • Slurm hybride taken. Slurm, een veelgebruikte taakplanner voor HPC-systemen (High Performance Computing), is in eerdere secties geïntroduceerd voor een basisbegrip. Deze module behandelt de specifieke resource-toewijzingsparameters voor hybride taken met gedeeld en gedistribueerd geheugen.
    • Nodes, cores en taken. Dit segment behandelt de fundamentele concepten van nodes, cores en taken, en benadrukt hun rol binnen de context van HPC-systemen.
    • Bindingen. Het concept van bindingen wordt verkend, waarbij inzicht wordt gegeven in hoe taken worden geassocieerd met specifieke bronnen, waardoor de deelnemers een beter begrip krijgen van de mechanismen voor het toewijzen van bronnen.
    • Hands on. We draaien de vectoroptiek kernel met meerdere configuraties met behulp van een set scripts.
  • QCG pilottaak. In sommige gevallen moeten gebruikers een groot aantal lichtgewicht cases uitvoeren. De nodes van supercomputers zijn echter te krachtig en laten alleen relatief grote partities toe. De kleinst mogelijke toewijzing op Snellius is bijvoorbeeld 1/4 van een node: 32 cores en 64 GB. Job concurrency is een veelgebruikte strategie om efficiënt meerdere lichtgewicht jobs op zulke grote partities te lanceren.
    • Grondbeginselen van job concurrency. Dit segment bespreekt de basisprincipes die ten grondslag liggen aan job concurrency. Job concurrency is een methodologische aanpak die de gelijktijdige uitvoering van meerdere kleinere jobs binnen een grotere toegewezen partitie mogelijk maakt. Het doel is om het gebruik van bronnen te optimaliseren en de efficiëntie te verbeteren in scenario's waar lichtere taken worden uitgevoerd op nodes die ontworpen zijn voor zwaardere werklasten.
    • Praktijkgerichte QCG PilotJob. Deze hands-on sessie biedt deelnemers praktische ervaring met het QCG Pilotjob framework. Deelnemers krijgen praktische inzichten in de strategieën en technieken voor het gebruik van job concurrency om meerdere lichtgewicht jobs te starten en te beheren binnen de context van omvangrijke node-partities.

Vereisten

Deelname aan de cursus Inleiding tot Supercomputing, deel I

De voertaal is Engels

Locatie

TU/e Eindhoven