Wat is Gaia-X, voor wie is het, en hoe gebruik je het?

Wat zijn data spaces?

Wat is Gaia-X, voor wie is het, en hoe gebruik je het?
?????????????

Het Europese Gaia-X-initiatief wil data delen mogelijk maken op een veilige, gedecentraliseerde en soevereine manier. Daartoe wil Gaia-X geen Europese cloud uit de grond stampen, maar wel bouwstenen aanreiken aan organisaties om bovenop bestaande infrastructuur een veilige data-omgeving te bouwen. We leggen in mensentaal uit wat dat concreet betekent.

In 2019 lanceerden de Duitse Minister voor Economische zaken Peter Altmaier en zijn toenmalige Franse collega Bruno Le Maire het Gaia-X-initiatief. Het doel was toen hetzelfde als vandaag: een veilige, betrouwbare, gedecentraliseerde structuur ontwikkelen waarin organisaties data kunnen delen, zonder soevereiniteit over die gegevens op te geven.

Dat is geen eenvoudige opdracht. Gaia-X werd in de media wat kort door de bocht afgeschilderd als een Europese cloud, maar dat biedt de organisatie hoegenaamd niet: dat laat het over aan partijen zoals OHVCloud. De non-profit met hoofdkwartier in Brussel voorziet in de plek daarvan een architectuur en een set van standaarden waarmee bedrijven zelf aan de slag kunnen.

  • Gaia-X is een non-profit die wil dat organisaties veilig onder elkaar data kunnen delen. Daartoe ontwikkelt Gaia-X componenten en standaarden voor een architectuur die uitwisseling van data op een decentrale manier toelaat.

Data spaces

Dat kan nog concreter: Gaia-X bouwt code en standaarden die bedrijven kunnen gebruiken om data spaces te bouwen. De data space staat centraal in het opzet van Gaia-X. Gaia-X is dus geen cloud of product, maar een non-profit die verschillende componenten ontwikkelt en aanbiedt.

Een data space is een ecosysteem waarin verschillende deelnemers data aanbieden en/of gebruiken. Zo’n ecosysteem waarin data gedeeld worden, kan rond verschillende onderwerpen ontstaan. Denk aan een data space voor landbouwdata, afkomstig van landbouwbedrijven en milieuorganisaties in een land of zelfs de hele EU, een data space in de chemiesector, of een specifieke data space voor een heel sectorgebonden ecosysteem.

Zo hebben Airbus en Franse kerncentrale-bouwer EDF allebei een data space opgezet waarin hun duizenden grote en kleine toeleveranciers samen hun data kunnen delen.

  • Om veilig en gedecentraliseerd data delen mogelijk te maken, ontwikkelde Gaia-X het concept van de data spaces: geconnecteerde ecosystemen waarin honderden of duizenden bedrijven groot en klein veilig, conform de regels en zonder eigendom van hun data op te geven, gegevens onderling kunnen delen.

Deelnemen aan een data space

De standaarden die Gaia-X hiervoor aanlevert, zijn herbruikbaar over sectoren heen. Een deelnemer aan één data space kan zich dus (technisch) relatief eenvoudig aanmelden voor een andere data space.

1. Identiteit

Dat gaat als volgt: Om deel te nemen aan een data space, moet je als organisatie eerst een veilige digitale identiteit aanmaken. Dat gebeurt via een provider, waarbij een bedrijf uiteindelijk een private cryptografische sleutel krijgt waarmee het zich kan identificeren.

  • Om deel te nemen aan een data space, heb je een verifieerbare digitale identiteit nodig.

2. Aanmelden

Vervolgens kan de organisatie zich aanmelden bij een data space. Een provider van slimme verlichting kan zich bijvoorbeeld aanmelden bij een smart city-data space, waarin andere deelnemers onder andere gegevens aanbieden over het verkeer, temperatuur en luchtkwaliteit. Misschien neemt een overheidsdienst verantwoordelijk voor wegenbouw ook wel mee aan de data space.

  • Organisaties kunnen zich aanmelden bij bestaande data spaces, wanneer die relevant zijn voor de data die ze kunnen aanbieden of willen gebruiken.

3. Spelregels

De data space is tot stand gekomen op initiatief van enkele initiële deelnemers die de kar getrokken hebben. Zij hebben de regels van het ecosysteem opgesteld. Die regels gaan bijvoorbeeld over wie kan deelnemen, maar ook hoe veilig data moeten zijn en met wie ze gedeeld kunnen worden. Voor de nucleaire data space van EDF en die van de toeleveringsketen van Airbus zijn de vereisten rond datasoevereiniteit natuurlijk heel hoog. Eén of meerdere partijen hebben de verantwoordelijkheid over het beheer van de data space.

De nieuwe deelnemer tekent enkele documenten en geeft aan de regels te volgen, en kan nu met de verkregen identiteit deelnemen aan de data space.

  • Data spaces omvatten honderden deelnemers, maar staan onder het bewind van een organisatie die in samenspraak met de oprichters de regels rond deelname, wetgeving en datasoevereiniteit vaststelt.

4. Verbinden met de data space

Vervolgens moet de nieuwe partij connecteren met de data. Ofwel biedt een organisatie nieuwe data aan, ofwel heeft ze data uit de data space nodig. Een combinatie kan natuurlijk ook. Data verbinden kan vanop de plek waar die data staan. Een data space is geen gecentraliseerde dataserver.  De verbinding komt tot stand via connectoren, waarvan er tientallen beschikbaar zijn. Die bouwt Gaia-X niet zelf, maar zijn beschikbaar via verschillende aanbieders.

Dit is een klein IT-project, dat idealiter zo eenvoudig mogelijk blijft. Data spaces zijn in de regel voorzien op deelname van kmo’s met beperkte IT-middelen. Connectoren zorgen er bijvoorbeeld voor dat je databases bruikbaar zijn door anderen, of dat data van derden in jouw ERP-systeem terech komen.

  • Verbinden met een data space doe je met connectoren. Die zijn beschikbaar in de markt, maar worden niet door het bedrijf Gaia-X zelf ontwikkeld.

In de data space bestaat een catalogus. Daar vinden deelnemers welke data beschikbaar zijn, voor wie, en onder welke voorwaarden. De aanbieder stelt die voorwaarden helemaal zelf.

  • De beschikbare data in een data space, en de voorwaarden die daarbij horen, zijn beschikbaar via een catalogus, toegankelijk voor deelnemers van de data space.

5. Conformiteit en soevereiniteit

Wie data aanbiedt, moet dat op een veilige conforme manier doen. Data aanbieden moet bovendien niet vanop je eigen server: het is perfect mogelijk om clouddiensten te gebruiken. In beide gevallen zorgt Gaia-X voor certificatie, die aangeeft hoe veilig en soeverein een databron effectief is.

Gaia-X voorziet vier niveaus: Gaia-X Compliant, Level 1, Level 2 en Level 3. Het laagste niveau betekent enkel dat een dienst compatibel is met de technische vereisten van een data space, en dus geconnecteerd kan worden.

Level 3-diensten zitten aan het andere uiterste en zijn compleet soeverein. Ze kunnen enkel geboden worden door providers met hoofdkwartier in de EU. Er zijn vandaag vijf aanbieders van Level 3 diensten in de EU, maar dat aantal zal nog sterk groeien. OVHCloud biedt bijvoorbeeld Level 3-gecertifieerde diensten. Dit label mag je niet verwarren met de soevereiniteitsscore die de EU zelf heeft geïntroduceerd, al maakt Gaia-X zich sterk dat de twee systemen redelijk goed overeenstemmen.

lees ook

Een label voor soevereiniteit: eerste Gaia-X Level 3-cloudbedrijven verzameld in catalogus

Een bedrijf dat vanop eigen servers of infrastructuur in een colocatie-datacenter data aanbiedt in de data space, is op die manier een provider en dient ook gecertifieerd te worden. De Gaia-X-labels zijn ook voor zo’n partijen beschikbaar.

  • Gaia-X voorziet een certificeringsmechanisme dat aangeeft in welke mate een (cloud)dienst of aanbieder van data aan soevereiniteitsvereisten voldoet.

6. Gaia-X Digital Clearing Houses

Dan is er nog het sluitstuk: de Gaia-X Digital Clearing Houses (GXDCH). Dat zijn instanties die deelnemers aan data spaces (automatisch) controleren. De clearing houses verifiëren onder andere de in het begin verkregen identiteit. GXDCH’s kunnen deelnemers en data requests toetsen aan tal van regels. Sinds de release van Gaia-X Danube gaat het daarbij niet alleen om EU-regels, maar ook arbitraire internationale of sectorgebonden richtlijnen rond data.

De Clearing Houses zijn dus nodes die compliance verifiëren. Dat gebeurt automatisch en softwarematig. De nodes draaien de Gaia-X Trust Framework-code, die wel geschreven is door Gaia-X zelf. Een team van acht mensen, waaronder CTO Christoph Strnadl, zit daarachter.

Op dit moment zijn er elf door Gaia-X goedgekeurde GXDCH’s die zo’n controle-node aanbieden. Onder andere CISPE, NTT Data, OVHCloud en Proximus hebben zo’n Clearing Houses.

  • Gaia-X Digital Clearing Houses zijn erkende instanties die controle-nodes hosten waarmee ze continu controleren of deelnemers aan een data space zijn wie ze claimen te zijn (via de digitale identiteit), en of data conform de regels van het ecosysteem worden aangeboden.

Gaia-X bouwt het raamwerk

Met al die componenten kunnen organisaties een data space opzetten, eraan deelnemen en er data in uitwisselen. Een data space hoeft niet compleet soeverein te zijn, maar Gaia-X biedt wel de tools om compliance- en soevereiniteitsvereisten te integreren en te controleren. De Gaia-X Labels zorgen ervoor dat een data space clouddiensten kan integreren die aan die vereisten voldoen.

  • Samengevat: Gaia-X biedt de infrastructuur om veilig data spaces op te zetten, er aan deel te nemen en er diensten in aan te bieden. De Gaia-X Trust Framework-code, de Gaia-X-labels en de Gaia-X-technische standaarden zorgen ervoor dat die data spaces een architectuur delen, zodat organisaties idealiter aan meerdere data spaces kunnen deelnemen.

Een wereld van decentrale data spaces

Gaia-X hoopt zo dat er een wereld van geconnecteerde data spaces tot stand komt. Het Trust Framework maakt de technische connectie van deelnemers over verschillende ecosystemen heen mogelijk.

Die wereld van data spaces is helemaal gedecentraliseerd, en dus onafhankelijk van één technologiespeler. De componenten zijn open source. De architectuur zorgt ervoor dat organisaties hun data gericht en eventueel tegen een vergoeding kunnen aanbieden. Zo kunnen bedrijven hun data monetiseren, zonder dat daar een centrale speler tussen zit.

Verder zijn data spaces gecontroleerde sectorspecifieke omgevingen waarin AI-training op een veilige manier kan plaatsvinden. Een data space van de chemische sector zou de creatie van een LLM kunnen faciliteren waarin concurrenten hun data onder voorwaarden delen, om zo samen tot een product te komen waar ze allemaal hun voordeel uit halen.

  • Gaia-X hoopt dat er wereldwijd een veelvoud aan data spaces ontstaat, waarin bedrijven soeverein data delen en gebruiken om meerwaarde te creëren.

Van PoC naar productie

Wil je deelnemen aan een Gaia-X-data space? Dan dien je in eerste instantie op zoek te gaan naar een data space die relevant is voor jou. Dat is op dit moment nog niet vanzelfsprekend. Hoewel organisaties al meer dan 150 Gaia-X-data spaces hebben opgezet, zijn er maar een vijftiental economisch rendabele ecosystemen die uit de proof of concept-fase zijn.

  • Alle componenten voor data spaces zijn klaar voor gebruik, maar de wereld van data spaces moet nog groeien van PoC naar een veelvoud aan ecosystemen in productie.

Gaia-X is in dat opzicht nog een project in wording. Een betere balans tussen aanbieders van data en gebruikers, met een fair economisch model rond het gebruik van data, is daartoe de sleutel. Op dit moment wil Gaia-X vooral zo veel mogelijk organisaties, en dan vooral ook kmo’s, overtuigen om deel te nemen aan data spaces. Dan moet daar voor hen ook waarde in zitten. De architectuur om veilig en soeverein data te delen, is al wel helemaal klaar.