Skip to main content
Versie: 4.10.1

Datasets toevoegen

Het aanmaken van een dataset is de eerste stap in het toevoegen van nieuwe data. De tweede stap is het toevoegen van een databron.

Ga naar het tabblad 'DATASETS'. Als je rechten hebt om datasets toe te voegen, zul je boven de zoekbalk een knop zien met 'Dataset toevoegen'. Door op die knop te klikken begin je met het toevoegen van een dataset.

DataPlatform-metadataschema

DataPlatform ondersteunt meerdere metadataschema's. Welke velden aanwezig zijn in het metadataschema wordt beheerd met behulp van JSON-configuratiebestanden. Het metadataschema bestaat uit een aantal bouwstenen. Deze bouwstenen kunnen worden gecombineerd tot een compleet schema. Aangezien DataPlatform onderdeel moet kunnen zijn van een federatief systeem van metadatacatalogi, dienen de DataPlatform-metadata te voldoen aan een bepaalde standaard, bij voorkeur een landspecifiek DCAT-toepassingsprofiel.

Het opzetten van het metadataschema voor DataPlatform wordt gedaan door Civity.

Bouwstenen

CKAN

De eerste (en enige verplichte bouwsteen) bevat de door CKAN vereiste velden. Deze omvatten bijvoorbeeld een titel, beschrijving, trefwoorden en een licentie.

DCAT

De tweede belangrijke bouwsteen bevat de DCAT-velden. Momenteel is deze bouwsteen verreweg de grootste bouwsteen, die meer velden definieert dan welke andere bouwsteen dan ook. Voor verschillende landen zijn verschillende DCAT-toepassingsprofielen gemaakt die in DataPlatform kunnen worden geïmplementeerd. Momenteel zijn DCAT-AP-SE (Zweden) en DCAT-AP-DONL (Nederland) beschikbaar.

NGR

Voor Nederlandse klanten is een bouwsteen aanwezig om de informatie te verzamelen die het Nationaal Georegister (NGR) nodig heeft.

Overzicht van metadatavelden

Binnen het metadataschema zijn veel verschillende velden aanwezig die kunnen worden ingevuld. Velden met een asterisk zijn verplicht om in te vullen. Hieronder volgt een overzicht van de metadatavelden binnen het DataPlatform metadata schema.

image: Adding Datasets

Titel en URL

De titel die je kiest, wordt weergegeven als onderdeel van de URL van de dataset. De URL wordt gegenereerd in het volgende formaat: ckan-dataplatform-nl.dataplatform.nl/dataset/{dataset_id}. Wanneer de titel wordt gegenereerd in een URL, worden hoofdletters omgezet in kleine letters en worden spaties vervangen door koppeltekens (-).

Een titel is een unieke identificatie - deze moet kort en specifiek zijn. Zo is “Sportevenementen 2016 Utrecht” veel specifieker dan “Sportevenementen.” Voor de beste resultaten geef je de locatie van de dataset in de titel op, omdat gebruikers hierdoor jouw dataset beter kunnen vinden op het open data portaal

Een goede naamgevingsrichtlijn om te volgen bij het maken van een titel:

Basis_categorie - onderwerp - locatie:jaar - versie:nummer

Een voorbeeld aan de hand van onze naamgevingsrichtlijn:

Sport - Sportevenementen - Utrecht 2019 - Versie 1
SCREENCAST: adding a title

Omschrijving

Dit veld vertegenwoordigt een overzicht van jouw dataset. Jouw beschrijving moet de volgende vragen beantwoorden:

  • Waar gaan de gegevens over?
  • Waar komen de gegevens vandaan?
  • Wat is de kwaliteit van de data?
  • Over welke periode of periode werden de gegevens geregistreerd?

Je kunt Markdown syntax in het beschrijvingsveld. Hiermee kun je kopteksten, lijsten, vet en cursief gebruiken.

Als voorbeeld, de volgende Markdown syntax..

* **Beschrijving:** Sportevenementen Utrecht
* **Bron:** Afdeling Vergunningen
* **Doel:** Inzicht geven in gebeurtenissen vanuit de gemeente
* **Beperkingen:** Deze dataset mag niet worden gebruikt voor juridische doeleinden
* **Mogelijkheden:** Deze dataset kan gebruikt worden voor inzicht in locaties op een kaart
* * Coördinaten systeem: * * WGS84 *

..wordt weergegeven als:

  • Beschrijving: Sportevenementen Utrecht
  • Bron: Afdeling Vergunningen
  • Doel: Inzicht geven in gebeurtenissen vanuit de gemeente
  • Beperkingen: Deze dataset mag niet worden gebruikt voor juridische doeleinden
  • Mogelijkheden: Deze dataset kan gebruikt worden voor inzicht in locaties op een kaart
  • Coördinaten systeem: WGS84

Organisatie

Als je deel uitmaakt van een organisatie, mag je alleen datasets en databronnen toevoegen en beheren die zijn verbonden met die organisatie. dit veld wordt automatisch ingevuld.

Zichtbaarheid

In DataPlatform zijn er twee soorten zichtbaarheidsopties: 'Privé' en 'Publiek'. Datasets die als 'Privé' zijn ingesteld, kunnen binnen DataPlatform alleen worden bekeken door gebruikers met de juiste organisatierechten. Daarnaast is de dataset niet zichtbaar op het Open Data Portaal.

De zichtbaarheidsstatus van je dataset wordt aangegeven door een label in de rechterbovenhoek.

image: Dataset - Private Flag

Licentie

Licenties bepalen hoe jouw dataset mag worden gebruikt. Informatie over open data licenties vind je op Open Definition.

Licenties worden geselecteerd via een dropdownmenu; je moet een optie selecteren.

De standaardlicentie voor open data is 'Creative Commons CCZero'. Dit betekent dat de dataset onbeperkt gebruikt mag worden. Met de licentie "Creative Commons Attribution" kunnen gebruikers jouw gegevens vrij gebruiken, maar ze moeten verwijzen naar de bron van de gegevens.

Trefwoorden

Het is raadzaam om trefwoorden in te voeren die niet voorkomen in de omschrijving of titel van jouw dataset. Dataplatform indexeert namelijk al de trefwoorden in de velden Titel en Omschrijving.

Trefwoorden beïnvloeden zoektermen. Het gebruik van trefwoorden maakt jouw datasets gemakkelijker te vinden. Door de eerste paar letters van jouw beoogde tag in te voeren, zoekt Dataplatform naar de dichtstbijzijnde bestaande overeenkomst - als deze overeenkomt, klik je op het trefwoord in het dropdownmenu.

Als jouw beoogde trefwoord niet overeenkomt met bestaande vermeldingen, vul je het hele woord in en druk je op de enter-toets. Zodra jouw nieuwe trefwoord is ingevoerd, is het nu mogelijk om deze als een bestaand trefwoord te gebruiken. Als je het verkeerde trefwoord selecteert, kun je deze verwijderen door op het kruisje "X" voor het woord te klikken.

Taal

De standaardtaal is ingesteld op Nederlands, maar extra opties zijn beschikbaar via het dropdownmenu. Andere opties zijn: Engels, Fries en Duits.

Metadata Taal

De standaardtaal is ingesteld op Nederlands, maar extra opties zijn beschikbaar via het dropdownmenu.

Thema

Thema's zijn vooraf gedefinieerd op basis van de Overheid:TaxonomieBeleidsagenda waardelijst. Daarnaast is er de optie om 'Geen Thema' te kiezen. Wanneer je voor 'Geen Thema' kiest zal er een defaultwaarde (Bestuur) worden ingevuld wanneer de data wordt doorgezet naar data.overheid.nl.

Subthema

Subthema's zijn gekoppeld aan het thema wat erboven gekozen is.

Verstrekker/Publiceerder

Hier kies je de organisatie die verantwoordelijk is voor het beschikbaar stellen van de dataset. De lijst is op basis van de DONL:Organization waardelijst

Registratiehouder / Data-eigenaar

Hier kies je de organisatie die verantwoordelijk is voor de dataset. De lijst is op basis van de DONL:Organization waardelijst

Type contactpunt

Dit veld geeft aan of een contactpunt een persoon of organisatie is

Naam contactpunt

De eigenaar van de dataset, meestal is dit een organisatie (provincie, ministerie, gemeente, etc).

E-mail contactpunt

Dit is de e-mail van de organisatie, waarmee gebruikers contact kunnen opnemen als ze vragen of opmerkingen hebben. Dit is meestal een algemeen e-mailadres.

Telefoon contactpunt

Telefoonnummer van contactpersoon. Optioneel veld.

Locatie

Keuze van locatie van de dataset.

Einddatum

Einddatum van de dataset.

Geografisch gebied

Opties zijn afhankelijk van de gekozen waarde bij het veld Locatie.

Toegangsrechten/openbaarheid

Toegangsrechten kunnen informatie bevatten over toegang of beperkingen op basis van privacy-, beveiligings- of ander beleid.

De lijst is op basis van de Overheid:Openbaarheidsniveau waardelijst

Status

Status van de dataset. De lijst is op basis van de Overheid:DatasetStatus waardelijst

Uitgiftedatum

Datum waarop de dataset is gepubliceerd.

Type verandering

Laatste type bewerking van de dataset. De lijst is op basis van de ADMS:Changetype waardelijst

Geplande datum

Datum waarop dataset beschikbaar komt.

Updatefrequentie

Hiermee stel je de updatefrequentie van je dataset in. De lijst is op basis van de Overheid:Frequency waardelijst

Versie

Een versienummer of een andere versie-aanduiding voor de dataset.

Versietoelichting

Bevat een beschrijving van de verschillen tussen deze versie en een eerdere versie van de dataset.

Ruimtelijk referentiesysteem

Coördinaatstelsel databron. Geo-veld voor NGR.

Omgrenzende rechthoek

Omgrenzende rechthoek. Geo-veld voor NGR.

Resolutie

De resolutie van de schaal in meters. Geo-veld voor NGR.

Toepassingsschaal

De beoogde schaal waarop het bestand waarheidsgetrouw gebruikt mag worden. Dit moet een positief numeriek getal zijn. Geo-veld voor NGR.

Publiceren Geoserver

Als de dataset geografische gegevens bevat, kunnen deze worden doorgezet naar GeoServer.

Publiceren Geonetwork (NGR)

Werkt alleen als het 'Publiceren Geoserver'-veld op 'Ja' is gezet. De NGR-informatie moet correct zijn ingesteld in de metadata van de organisatie.

Publiceren DONL (niet via NGR)

Deze optie wordt genegeerd als de optie geonetwerk is ingeschakeld. NGR zal in dat geval publiceren naar DONL.

Opslaan

Onderaan het metadataschema staan twee opties voor het opslaan van de gemaakte metadata. De opties zijn 'Opslaan zonder data' of 'Volgende: Data toevoegen'.

Met de eerste optie, 'Opslaan zonder data', sla je de dataset met alleen de metadata op. Er wordt geen databron bijgevoegd.

Met de tweede optie, 'Volgende: Data toevoegen', is er de mogelijkheid om de databronnen toe te voegen. Dit kan middels een externe URL of door een bestand toe te voegen.

Save