SURF Data Repository maakt grote datasets vindbaar en toegankelijk

Heb je jouw onderzoek afgerond en wil je de onderzoeksdata beschikbaar maken voor anderen? SURF Data Repository biedt betrouwbare en langdurige opslag van grote datasets en maakt deze vindbaar en toegankelijk. De repository is bovendien dichtbij onze rekendiensten gesitueerd, zodat beschikbare data eventueel snel verwerkt kunnen worden.

Files by Nick Lockey via Flickr

Data langdurig opslaan en toegankelijk houden

De Data Repository voorziet in langdurige opslag van onderzoeksdata. Na afronding van een onderzoeksproject is het vaak noodzakelijk om deze gegevens vindbaar en toegankelijk te houden.

"Mijn dataset van ruim 50 TB moet voor 10 jaar publiekelijk toegankelijk blijven."

Hoe werkt het?

Met behulp van metadatering en eventuele structurering van bestanden en relaties krijgt iedere individuele dataset een eigen zogeheten landing page met daarin alle gegevens die over de dataset bekend zijn. Iedere dataset en de bijbehorende bestanden krijgen permanente, unieke nummers (persistent identifiers) in de vorm van Digital Object Identifiers (DOI) en EPIC PID’s (voor bestanden). Deze kunnen gebruikt worden in nieuwe publicaties.

Je brengt jouw data eenvoudig over naar de Data Repository door in te loggen in de web-interface en jouw bestanden te uploaden. Is je dataset te groot om via een browser bij ons te krijgen? Dan kun je jouw gegevens efficiënt en snel verplaatsen met behulp van de REST API, of indirect via het Data Archive van SURF met behulp van diverse ondersteunde protocollen. Indien nodig, helpen de adviseurs van SURF je om, na upload en structurering van de data en aanlevering van metadata, de data in de repository te krijgen.

"Ik wil een persistent identifier kunnen gebruiken om in een artikel naar mijn grote dataset te kunnen verwijzen."

Komt mijn dataset in aanmerking voor deze dienst?

SURF Data Repository is ontworpen voor het publiceren van grote datasets: onderzoeksgegevens die in totaal enkele TB’s tot PB’s groot zijn. Voor kleinere datasets verwijzen wij je graag door naar DANS en/of 4TU. In Europees verband kun je ook gebruikmaken van de datadiensten van EUDAT of CERN.

Wil je met jouw groep of instituut meerdere datasets publiceren van verschillende grootte, informeer dan naar de mogelijkheden. Wil je zeker weten of jouw dataset in aanmerking komt voor deze dienst, kijk dan op de website van Research Data Netherlands (RDNL) en gebruik de beslissingstool. RDNL is een samenwerking tussen DANS, 4TU en SURF.

Tarieven

De tarieven voor deze dienst vind je in de brochure SURF Diensten en tarieven (pdf).

Ondersteuning en advies

Heb je advies of hulp nodig? Ons team staat voor je klaar. We helpen je bij de toegang tot de Data Repository en bij het opslaan, metadateren en structureren van data. Heb je meer inhoudelijk advies nodig? Onze consultancydienst helpt je verder. 

Geef je vragen of problemen door via:

De helpdesk is bereikbaar tijdens kantooruren (9.00–17.00 uur).

Databeveiliging bij SURF

Je kunt erop vertrouwen dat jouw onderzoeksdata en vertrouwelijke informatie die je bij SURF bewaart en verwerkt in veilige handen zijn. De SURF-vestiging in Amsterdam heeft het ISO 27001-certificaat. Dat betekent dat we voldoen aan de hoge eisen van deze internationale standaard van informatiebeveiliging.

Toegang 

De metadata van alle datasets zijn publiekelijk toegankelijk, en de bestanden van datasets die met het open-access-kenmerk zijn gepubliceerd kunnen door iedereen worden gedownload.

Geheimhouding

Heb je een account bij SURF? Al onze accounts zijn persoonlijk en alleen voor jou toegankelijk. Je bent zelf verantwoordelijk voor het beheer van je account en de data die je erin opslaat. SURF biedt ondersteuning bij publicaties, maar jij bepaalt welke datasets je publiceert en welke gegevens in metadata belanden.

Beheerders hebben toegangsrechten tot de opgeslagen data, maar maken daar alleen gebruik van wanneer het noodzakelijk is voor het beheer. Zij hebben geheimhoudingsplicht en gaan integer om met informatie en privacy volgens de interne IT-beheersregels van SURF en ISO 27001.

De dataverwerkersrol van SURF kan eventueel worden vastgelegd in een Service Level Agreement (SLA) of Digital Privacy Agreement (DPA).

Versleutelen

Bestanden worden versleuteld overgedragen met het HTTPS-protocol en SSH File Transfer Protocol (SFTP).

We adviseren je om vooraf contact op te nemen met de privacy officer of functionaris gegevensbescherming van jouw instelling voor informatie over de eisen die worden gesteld aan de bescherming van gegevens.

Vraag toegang aan

Deze dienst is beschikbaar voor onderzoekers van instellingen voor hoger onderwijs en onderzoek. Als onderzoeker kan je een aanvraag indienen bij SURF, of op basis van een bestaand contract via jouw instelling toegang krijgen tot deze dienst. Neem contact met ons op om na te gaan of jouw instelling een contract heeft voor deze dienst. Andere onderzoeksinstellingen of –afdelingen kunnen bij SURF een offerte aanvragen.

Toegang via SURF voor individuele onderzoekers

Ben je een (wetenschappelijk) onderzoeker aan een universiteit of onderzoeks- of onderwijsinstelling, dan kan je door middel van een individuele aanvraag via info@surf.nl toegang krijgen tot deze dienst.

Offerte

Heeft jouw instelling geen contract met ons? Dan kan je een offerte aanvragen via info@surf.nl. De tarieven hangen af van de omvang en duur van opslag op de Data Repository.

(Foto: Nick Lockey)