Platform Open Data Explorer
Nieuws

Wanted! Testers voor Open Data Explorer: platform dat rekenkracht naar open onderzoeksdata brengt

Ben je een onderzoeker of datasteward die met open datasets werkt? Dan ben je welkom om te experimenteren met het eerste prototype van een nieuw onderzoeksdataplatform dat interactieve verkennende datasetanalyses mogelijk maakt zonder te downloaden! Je feedback helpt de Open Data Explorer te verbeteren, die naar verwachting begin 2024 wordt gelanceerd.

Samenvatting

Het Open Data Explorer-project heeft tot doel de opslagplaatsen voor onderzoeksgegevens (hierna: research data repositories) aan te vullen met computemogelijkheden die gearchiveerde onderzoeksgegevens tot "leven" brengen door ze interactief raadpleegbaar te maken. Door gebruik te maken van research data repositories kunnen onderzoekers datasets vinden, gerelateerde metadata bekijken en af ​​en toe ook een voorbeeld van de data-inhoud bekijken. Elke verdere analyse – ook simpel en verkennend – vereist op dit moment echter dat de onderzoekers eerst de datasets downloaden en manieren vinden om ze te verkennen om de inhoud en kwaliteit ervan beter te begrijpen.

Geen wachttijd meer voor het verkennen en visualiseren van onderzoeksgegevens

Open Data Explorer heeft tot doel een snelle verkennende data-analyse en -visualisatie te vergemakkelijken door een kant-en-klaar interactief computeplatform te bieden waar onderzoeksgegevens direct beschikbaar zijn voor verdere verwerking.



De Open Data Explorer biedt onderzoekers de volgende voordelen:

• Geen wachttijd voor toegang tot een groot aantal datasets: analyseklare versies van populaire en nieuwe datasets uit grote research data repositories zijn direct beschikbaar voor computing.

• Kant-en-klare compute-omgeving voor analyse: de op JupyterLab gebaseerde omgeving ondersteunt interactieve notebooks en een brede set aan pakketten voor gegevenstoegang, analyse en visualisatie in meerdere talen (bijvoorbeeld Python, R).

• Voorbeelden van verkennende data-analyse-notebooks: notebooks worden automatisch gegenereerd en afgestemd op de inhoud van de dataset om snelle data-analyse met minimale gebruikersinvoer mogelijk te maken.

• Ondersteuning voor coderen op basis van AI: de speciale codebot kan je tijdens het werken met de notebooks helpen bij het uitvoeren van verkennende gegevensanalyses.

Het Open Data Explorer-platform voorkomt onnodig downloaden van datasets en verkort de tijd om onderzoeksgegevens te verkennen en maakt een aparte compute-omgeving voor het analyseren en visualiseren van gegevens overbodig. Het platform is ook nuttig voor het trainen en demonstreren van best practices, wat vooral van nut kan zijn voor datastewards. Verdere integratie met de intrastructuurdiensten van SURF wordt in de toekomst voorzien.

Probeer nu!

Het prototypeplatform is nu beschikbaar voor tests en feedback: https://opendataexplorer.org. Tot 26 januari 2024 kun jij de beschikbare functionaliteiten uitproberen, je feedback delen en zo het projectteam helpen het platform te verbeteren.

Achtergrondinformatie

Dit project is een door SURF gefinancierd initiatief van het Digital Competence Center dat begin 2023 van start is gegaan. Betrokken onderzoeksorganisaties: Universiteit Twente, TU Delft en 4TU.ResearchData. Het Centre of Expertise in Big Geodata Science is de wetenschappelijke trekker van het project.

Contact

Voor meer informatie:

Contactpersoon algemeen: dr. ing. Serkan Girgin, universitair hoofddocent en hoofd van het Centre of Expertise in Big Geodata Science, s.girgin@utwente.nl, +31 53 489 5578.

Contactpersoon SURF/DCC’s: dr. Ir. Karín Chavez-Caballero, Msc, EMBA, karin.chavezcaballero@surf.nl, 06 18 59 12 53.