Trainingen

Wilt u met onze systemen aan de slag, maar mist u de benodigde kennis? Wij organiseren regelmatig hands-on systeemtrainingen op onze kantoren in Utrecht en Amsterdam of op locatie bij uw onderwijs- of onderzoeksinstelling. Bekijk het overzicht en geef uw interesse aan ons door via training@surfsara.nl.

Introductie big data en Hadoop

Duur: 2 dagdelen

Inhoud: U krijgt een introductie over big data, gevolgd door uitleg over de geschiedenis en de globale werking van Hadoop. Zonder technische details geven we een overzicht van het nut en de noodzaak van: MapReduce, Pig, Apache Hive, HBase, YARN, CAP theorema, Lambda Architectuur en NoSQL. Voorbeelden van best en bad practices in het gebruik zorgen voor heldere inzichten in toepassingen.

Doelgroep: Voor wie een globaal en compleet overzicht wil van big data-analyse en Hadoop, maar geen technische achtergrond heeft.

Data-analyse met Apache Spark

Duur: 1 of 2 dagdelen

Inhoud: Apache Spark is een open-source framework waarmee je gemakkelijk met data-analyse-applicaties terabytes data kan verwerken. Het is een populaire tool voor bigdata-analyse en in gebruik door technologiebedrijven zoals Facebook, Uber en Netflix. Spark is geschikt voor: data pre-processing, machine learning, Natural language processing, structured querying met SQL en het combineren van streaming en batch-processing. Je leert in deze workshop alles over de concepten en uitdagingen van large-scale datascience. Je gaat zelf aan de slag met hands-on Spark-opdrachten om precies te ondervinden hoe het werkt.

Doelgroep: Voor onderzoekers, studenten, IT-medewerkers en datascientists die Spark willen inzetten voor data-analyses.

Inleiding Unix

Duur: 2 uur

Inhoud: U leert hoe de opbouw van Unix-besturingssystemen in elkaar steekt en wat de basiscommando’s zijn. U oefent zelf met werken via de command line en het geven van een aantal commando’s.

Doelgroep: Voor wie voldoende basiskennis van Unix wil om ermee te werken op bijvoorbeeld het SURFsara-rekencluster of de supercomputer Cartesius. U kent de besturingssystemen Windows of OS X.

Inleiding MPI

Duur: 2 dagen

Inhoud: U leert hoe Message Passing Interface (MPI) werkt, een standaard die communicatie tussen processen vereenvoudigt en zo helpt bij het programmeren van (grootschalige) parallelle computers. We geven uitleg over zowel de basisprincipes send, receive en broadcast als over meer geavanceerde onderwerpen. Beide dagen gaat u zelf aan de slag met praktische oefeningen.

Doelgroep: Voor wie wil leren hoe MPI werkt om hier zelfstandig mee aan de slag te kunnen. U hebt ervaring met de programmeertalen C of Fortran.

Inleiding Intel Xeon Phi training

Duur: 1 dagdeel

Inhoud: U leert werken met Intel Xeon Phi, coprocessors die met parallelle verwerking de prestaties van toepassingen sterk verbeteren. Het LISA Rekencluster van SURFsara bevat Intel Xeon Phi- processors. U oefent met praktische opdrachten.

Doelgroep: Voor wie wil leren hoe Intel Xeon Phi-coprocessors werken om hier zelfstandig mee aan de slag te kunnen. U kent de Unix command line en hebt ervaring met de programmeertalen C of Fortran.

Inleiding GPU programmeren

Duur: 1 dagdeel

Inhoud: U leert hoe NVIDIA GPU's en CUDA samenwerken en maakt kennis met verschillende parallel-programmeertechnieken. U leert werken met bestaande bibliotheken die gebruikmaken van GPU-versnelling. U krijgt praktische voorbeelden van de meeste technieken, inclusief GPU-programmeermodellen zoals OpenACC.

Doelgroep: Voor wie wil leren hoe GPU's werken om hier zelfstandig mee aan de slag te kunnen. U kent de Unix command line en hebt ervaring met de programmeertalen C of Fortran.

Inleiding Visualisatie

Duur: 1 dagdeel

Inhoud: U krijgt uitleg over het visualiseren van wetenschappelijke gegevens. Visualisatie geeft u inzicht in opvallende verschijnselen in de data, helpt u om de correctheid van resultaten te controleren en om resultaten op een inzichtelijke manier te presenteren en te communiceren. Uw onderzoeksresultaten kunt u bijvoorbeeld via visualisatie op afstand (remote visualisatie) tonen, voor datasets die te groot en complex zijn om lokaal (op uw eigen laptop) te visualiseren.

Verschillende soorten data vragen om verschillende visualisatiemethoden, -technieken en -tools. U krijgt voorbeelden van 2D- en 3D-simulaties, geografische data en netwerken. De visualisaties bestaan uit afbeeldingen en videomateriaal en zelfs interactieve visualisaties op het web. U oefent met bestaande onderzoeksdata, maar u kunt ook uw eigen data meenemen.

Doelgroep: Voor wie wil weten hoe visualisatie helpt bij het verkrijgen van inzicht in onderzoeksdata. U heeft kennis van wetenschappelijk onderzoek.

Systeemtraining

Aan de slag met HPC Cloud

Duur: 1 dag

Inhoud: U leert werken met HPC Cloud van SURFsara. Alles komt aan bod, van het inloggen op de virtuele omgeving via OpenNebula tot het draaien van een eenvoudig MPI-programma en het uitvoeren van gedistribueerde processen. U voert zelf praktijkopdrachten uit op het HPC Cloud en zet zelf een cluster op.

Doelgroep: Voor wie aan de slag wil met HPC Cloud. U kent de basics van programmeren en de Unix command line.

Aan de slag met het Hadoop-cluster

Duur: 1 dag

Inhoud: U leert werken met het Hadoop-cluster van SURFsara. Hoe u rekent met MapReduce, Apache Spark, Hive, Pig en HBase. U gaat zelf oefenen op het Hadoop-cluster en lokaal op een virtual machine (VM).

Doelgroep: Voor wie aan de slag wil met het Hadoop-cluster om big data-analyses uit te voeren. U kent de basics van programmeren en de Unix command line.

Aan de slag met Grid computing

Duur: 1 dag

Inhoud: U leert werken met de Grid-rekenclusters en de bijbehorende dataopslagsystemen van SURFsara. U krijgt een overzicht van de basisconcepten van Grid-computing zoals het parallelliseren op het Grid, taakdistributie, monitoring en datamanagement. Deze training is ook online beschikbaar en kunt u in uw eigen tijd volgen.

Doelgroep: Voor wie aan de slag wil met Grid-computing. U kent de basics van programmeren en de Unix command line.

Aan de slag met supercomputer Cartesius en rekencluster LISA

Duur: 1 dagdeel

Inhoud: U leert werken met de supercomputer Cartesius en het rekencluster LISA van SURFsara. We leggen uit wanneer u de supercomputer nodig hebt en welke toepassingen het LISA-cluster heeft. De hands-ontraining bevat zowel een interactief deel op de login nodes als een batchdeel op de worker nodes. U maakt gebruik van capability en capacity clustercomputers.

Doelgroep: Voor wie aan de slag wil met Cartesius en LISA. U kent de basics van programmeren en de Unix command line.

Aan de slag met iRODS en EUDAT datamanagement

Duur: 2 dagen

Inhoud: U leert een datamanagementinfrastructuur op te zetten met applicaties als iRODS (Integrated Rule-Oriented Data System) en PIDs (persistent identifiers). Via use cases krijgt u inzicht in de werking hiervan. Ook oefent u zelf met de applicaties op virtuele machines. Daarnaast presenteren we datamanagement services van de organisatie EUDAT (European Data Infrastructure).

Doelgroep: Voor wie aan de slag wil met datamanagementapplicaties. U kent de basics van programmeren en de Unix command line.