Nieuws

SURF Data Archief gegroeid tot 100 PB aan onderzoeksdata

Het data-archief van SURF heeft een nieuwe mijlpaal bereikt: onderzoekers bewaren op dit moment 100 petabyte (PB) aan data op ons systeem. Dit is een verdubbeling ten opzichte van 4 jaar geleden. Het data-archief is onze gecentraliseerde locatie voor langetermijnopslag van onderzoeksgegevens.
Tape opslag

Hoeveel data zijn 100 petabytes?  

100 petabytes  
100.000 terabytes
100.000.000 gigabytes   
100.000.000.000 megabytes  

  • Als we de gegevens op CD's zouden opslaan, zouden we een stapel van 184 km hoog hebben.  
  • Als de bestanden muziek waren, kunnen we er 11.384.615.322 minuten of 12.450 jaar naar luisteren.  
  • En naar films zouden we 47.058.823 uur of 5.372 jaar kunnen kijken.   
  • Als we de gegevens op dvd's zouden opslaan, zouden we een stapel van 14 km hoog krijgen.  
  • Als we de gegevens op Amazon S3 zouden opslaan, zou dat ons $2.250.000 per maand kosten.  

Met onze huidige archiefbibliotheken en de nieuwste LTO-tapedrive-technologie kunnen we zelfs nog meer opslaan. Op dit moment hebben we in totaal plek voor 20.000 tapes in onze twee tape libraries, waar we 12TB*20.000=240PB zouden kunnen opslaan.   

Welke gegevens bewaren wij?   

SURF bewaart natuurlijk geen muziek of films op het archief, maar wetenschappelijke gegevens. Onze grootgebruikers komen uit de vakgebieden Astrofysica en Deeltjesfysica.  

Data Archive growth chart

Echte gegevens vs. beheerde gegevens  

Als we al onze gebruikers zouden vragen hoeveel data ze opslaan, zouden we niet uitkomen op 100 PB maar ‘slechts’ op 77,9 PB. Dit komt omdat de meeste van onze gebruikers een dubbele kopie van de gegevens opslaan zonder dat ze het weten. Om ervoor te zorgen dat de gegevens ook in geval van een ramp bewaard blijven, slaat SURF de gegevens op in twee bibliotheken op verschillende plaatsen in Amsterdam. Sommige gebruikers, zoals de High-Energy Particles Physics-community's, slaan slechts één kopie op bij SURF omdat ze een tweede (of soms derde) kopie hebben in andere datacenters in de wereld.