Since the start of this year I am actively tracking the suite of new European laws being proposed on digitisation and data. Together they are the expression into law of the geopolitical position the EU is taking on everything digital and data, and all the proposed laws follow the same logic and reasoning. Taken together they shape how Europe wants to use the potential and benefits of digitisation and data use, including specifically for a range of societal challenges, while defending and strengthening citizen rights. Of course other EU legal initiatives in parallel sometimes point in different directions (e.g. EU copyright regulations leading to upload filters, and the attempts at backdooring end-to-end encryption in messaging apps for mass surveillance), but that is precisely why to me this suite of regulations stands out. Where other legal initiatives often seem to stand on their own, and bear the marks of lobbying and singular industry interests, this group of measures all build on the same logic and read internally consistent as well as an expression of an actual vision.

My work is to help translate the proposed legal framework to how it will impact and provide opportunity to large Dutch government data holders and policy departments, and to build connections and networks between all kinds of stakeholders around relevant societal issues and related use cases. This to shape the transition from the data provision oriented INSPIRE program (sharing and harmonising geo-data across the EU), to a use needs and benefits oriented approach (reasoning from a societal issue to solve towards with a network of relevant parties towards the data that can provide agency for reaching a solution). My work follows directly from the research I did last year to establish a list of EU wide high value data sets to be opened, where I dived deeply into all government data and its governance concerning earth observation, environment and meteorology, while other team members did the same for geo-data, statistics, company registers, and mobility.

All the elements in the proposed legal framework will be decided upon in the coming year or so, and enter into force probably after a 2 year grace period. So by 2025 this should be in place. In the meantime many organisations, as well as public funding, will focus on already implementing elements of it even while nothing is mandatory yet. As with the GDPR, the legal framework once in place will also be an export mechanism of the notions and values expressed in it to the rest of the world. This as compliance is tied to EU market access and having EU citizens as clients wherever they are.

One element of the framework is already in place, the GDPR. The newly proposed elements mimic the fine structures of the GDPR for non-compliance.
The new elements take the EU Digital Compass and EU Digital Rights and Principles for which a public consultation is now open until 2 September as a starting point.

The new proposed laws are:

Digital Markets Act (download), which applies to all dominant market parties, in terms of platform providers as well as physical network providers, that de facto are gatekeepers to access by both citizens and market entities. It aims for a digital unified market, and sets requirements for interoperability, ‘service neutrality’ of platforms, and to prevent lock-in. Proposed in November 2020.

Digital Services Act (download), applies to both gatekeepers (see previous point) and other digital service providers that act as intermediaries. Aims for a level playing field and diversity of service providers, protection of citizen rights, and requires transparency and accountability mechanisms. Proposed in November 2020.

AI Regulatory Proposal (download), does not regulate AI technology, but the EU market access of AI applications and usage. Market access is based on an assessment of risk to citizen rights and to safety (think of use in vehicles etc). It’s a CE mark for AI. It periodically updates a list of technologies considered within scope, and a list of areas that count as high risk. With increasing risk more stringent requirements on transparency, accountability and explainability are set. Creates GDPR style national and European authorities for complaints and enforcement. Responsibilities are given to the producer of an application, distributors as well as users of such an application. It’s the world’s first attempt of regulating AI and I think it is rather elegant in tying market access to citizen rights. Proposed in April 2021.

Data Governance Act (download), makes government held data that isn’t available under open data regulations available for use (but not for sharing), introduces the European dataspace (created from multiple sectoral data spaces), mandates EU wide interoperable infrastructure around which data governance and standardisation practices are positioned, and coins the concept of data altruism (meaning you can securely share your personal data or company confidential data for specific temporary use cases). This law aims at making more data available for usage, if not for (public) sharing. Proposed November 2020.

Data Act, currently open for public consultation until 2 September 2021. Will introduce rules around the possibilities the Data Governance Act creates, will set conditions and requirements for B2B cross-border and cross-sectoral data sharing, for B2G data sharing in the context of societal challenges, and will set transparency and accountability requirements for them. To be proposed towards the end of 2021.

Open Data Directive, which sets the conditions and requirements for open government data (which build on the national access to information regulations in the member states, hence the Data Governance Act as well which does not build on national access regimes). The Open Data Directive was proposed in 2018 and decided in 2019, as the new iteration of the preceding Public Sector Information directives. It should have been transposed into national law by 1 July 2021, but not all MS have done so (in fact the Netherlands has just recently started the work). An important element in this Directive is EU High Value Data list, which will make publication of open data through APIs and machine readable bulk download mandatory for all EU member states for the data listed. As mentioned above, last year I was part of the research team that did the impact assessments and proposed the policy options for that list (I led the research for earth observation, environment and meteorology). The implementation act for the EU High Value Data list will be published in September, and I expect it to e.g. add an open data requirement to most of the INSPIRE themes.

Most of the elements in this list are proposed as Acts, meaning they will have power of law across the EU as soon as they are agreed between the European Parliament, the EU council of heads of government and the European Commission and don’t require transposition into national law first. Also of note is that currently ongoing revisions and evaluations of connected EU directives (INSPIRE, ITS etc.) are being shaped along the lines of the Acts mentioned above. This means that more specific data oriented regulations closer to specific policy domains are already being changed in this direction. Similarly policy proposals such as the European Green Deal are very clearly building on the EU digital and data strategies to achieving and monitoring those policy ambitions. All in all it will be a very interesting few years in which this legal framework develops and gets applied, as it is a new fundamental wave of changes after the role the initial PSI Directive and INSPIRE directive had 15 to 20 years ago, with a much wider scope and much more at stake.

Risk Board Game
The geopolitics of digitisation and data. Image ‘Risk Board Game’ by Rob Bertholf, license CC BY

De Gemeente Amsterdam wil een meldingsplicht voor sensoren in de publieke ruimte. Iedere organisatie die sensoren in de buitenruimte plaatst zou vanaf het najaar moeten melden waar die sensoren staan. Dit is nuttig om meerdere redenen. Allereerst omwille van transparantie en om de discussie over nut en noodzaak van al die sensoren om ons heen diepgaand te kunnen voeren. Of om te zien welke gegevens die nu door private organisaties worden verzameld, eventueel ook voor een gedeeld publiek belang kunnen worden gebruikt.

Amsterdam gaf eerder al een voorbeeld dat navolging verdient met de start van een algoritme-register, en dit sensorenregister lijkt me een uitstekende aanvulling.

(Defect) reclamebord op Utrecht Centraal Station dat ik in 2018 fotografeerde, met een ondoordachte camera in de publieke ruimte om aandacht voor de advertentie te meten. Burgerlijk verzet plakte de camera af.

Today we had national parliamentary elections. Just before lunch E and I went to vote. As usual voting was uneventful, this time with added face masks and hand sanitizer.

Our neighbourhood polling station

This time around, to enable people to avoid lines, our city published live data on how busy polling stations are. Allowing you to choose one without too many people (you can pick any polling station in the municipality you reside in). Based on public data streams, and on Open Street Map. Well done. showing current activity at polling stations

The Open State Foundation (I’m a board member) published their current map of polling stations again at ‘Where’s my polling station‘, as they did for the national elections 4 years ago and the local elections since then. Their map is also Open Street Map based. OSF gets their data from each single municipality and republishes it as a national dataset., where is my polling station, with info on each polling station in the Netherlands

Good to see how open data is used to strengthen the democratic process in its most direct form.

This morning I gave a guest lecture at the Amsterdam University College as part of a course on Big Data mostly (using Rob Kitchin’s book The Data Revolution: Big Data, Open Data, Data Infrastructures and Their Consequences). I talked about open data, open government data more particularly. How it creates impact, the challenges for government in publishing it, and also quite a bit on the pitfalls connected to using open data for some sort of application. I ended on the note that the ethical issues tied to open data usage are also connected to the notion that data is now a prime geopolitical factor. Any choices you make w.r.t. re-using open data will therefore tell the world a lot about who you are, and to which of the geopolitical data propositions you adhere (e.g. surveillance capitalism, data driven statism, data driven enlightenment)

The lecturer I’ve known for a decade or so from open data efforts, and he invited me as well as TU Delft’s Frederika Welle Donker. She and I have been speaking together in various settings before. A combination that worked well again this time I think, my own practice based perspectives in combination with the insights that research provides from approaching in a more rigorous manner the same questions I deal with.

I published the slides and transcript in my new set-up running ‘my own Slideshare‘, and shared the URL at the start of the talk.
This came in handy as this of course was an online event, and convenient and immediate sharing of content makes more sense in such a setting than when doing a talk in the same room as the students.

It has been a while I did such a general introduction about open data. So I spent time yesterday evening and early this morning first rewatching a general talk I gave 8 years ago, and one two years ago, thinking about what are the current developments that are relevant, and current things we are actually working on (e.g. data governance and ethical issues).

16 years ago today I blogged about this new thing Jeremy Ruston had built and released, TiddlyWiki, a wiki that you could save as a single file. Using javascript and css within the file allowed for expanding the view on items, and added the wiki elements like WikiWords to build links. It was of interest because it was local first software and extremely easy to start using (even if you couldn’t yet save your Tiddlywiki easily then). Jeremy saw it as a tool for local first note taking, and as it was all contained in a single file it was easy to publish, or even send the whole thing as an email attachment. At the time I was using a wiki for notetaking, and so this tool was of interest to me.

I am glad that TiddlyWiki is still around all these years later. In the current attention for Digital Gardens, TiddlyWiki is mentioned and used frequently. A big thank you to Jeremy Ruston for bringing this tool into the world. He’s currently running Federatial which is “exploring a new wave of collaboration tools that eschew the old, crude hierarchical models of organization”. I read that as he is building tools that fit well with networked agency.

Iedereen hongert naar informatie, en naarmate we langer thuis zitten waarschijnlijk ook naar meer nuttige dingen om te doen. Data en informatie kan bij dat laatste helpen: om te zien waar je nuttig iets toe kunt voegen. Hoeveel materiaal is er beschikbaar in Nederland, en wat dreigt op te raken in een regio? Hoeveel tests worden er gedaan, hoeveel zijn er op voorraad? Welke maatregelen worden er precies genomen? Want het RIVM, GGD’s en zorginstellingen doen veel meer dan we kunnen zien. Het antwoord op die vragen is niet beschikbaar. En dus moet je of aannemen dat ‘de instanties’ het allemaal al geregeld hebben (en dat is niet waarschijnlijk want ook voor hen is een nieuwe en complexe situatie), of aannemen dat ze je bewust ongeïnformeerd houden en je niet als zelfstandige actor in deze situatie zien (en ook dat is niet waarschijnlijk, want onze medewerking is noodzakelijk).

Zelfs basale gegevens als het aantal positief getesten, overledenen, en ziekenhuisopnames, zijn niet beschikbaar als data. De cijfers worden wel genoemd in de dagelijkse nieuwsbulletins van het RIVM, maar bijvoorbeeld t.a.v. het aantal tests en ziekenhuisverblijven maar mondjesmaat en inconsistent. Het RIVM heeft wel een data site maar daar is het akelig stil.

Geen relevante zoekresultaten op

Ik maak sinds eind februari een excelblaadje, waarin ik elke dag een nieuwe regel toevoeg. Om daar uit af te leiden of we nog op de exponentiële curve zitten, of we in de buurt blijven van wat andere landen doormaken of daar vanaf wijken, en hoe dit zich verhoudt tot de cijfers over het aantal ziekenhuis- en IC-bedden. Raar natuurlijk dat die gegevens, die deels wel in de nieuwsberichten op de RIVM site staan, niet ook als data op diezelfde site te vinden zijn.

Door deze data niet standaard te delen bereik je 3 ongewenste effecten:

  • Je bent niet zelf de betrouwbaarste bron van data, iedereen die iets wil weten is afhankelijk van materiaal uit tweede (of erger) hand.
  • Het is onmogelijk om snel na te gaan of een artikel dat je leest zich baseert op kloppende brongegevens
  • Data en informatie is een middel om anderen in staat te stellen in actie te komen op manieren die het werk van het RIVM en de zorginstellingen ondersteunen. Gebrek aan informatie doemt ons op zijn best tot stilzitten, op zijn ergst tot ongeïnformeerde en schadelijke keuzes.

Die laatste van de drie is het belangrijkst. En dus is het nodig vragen aan het RIVM te stellen naar die gegevens. Dergelijke vragen worden snel als lastig, kritisch en storend ervaren. Het RIVM is volledig bezet met het bestrijden van de epidemie, en dan is elke afleiding storend. Maar in een crisis is zo groot mogelijk transparantie geven juist van belang. Dan hebben wij allemaal meer informatie om onze eigen beslissingen op te baseren, en beter te snappen waar we aan toe zijn. Die transparantie is niet alleen een taak van het RIVM, maar ook van de veiligheidsregio’s. Die veiligheidsregio’s tekenen de verordeningen waarin de beperkingen worden vastgelegd die we nu hebben. Het bestuur van die regio’s zijn de burgemeesters van de gemeenten die er binnen vallen. Die burgemeesters dienen een grotere rol te hebben in de communicatie naar hun inwoners. Niet alleen mondelinge communicatie, maar ook de feiten over de eigen regio gevat in data.

Vragen stellen aan het RIVM op dit moment werkt storend voor het RIVM, leidt af in een tijd van grote drukte en stress. Criticasters leiden alleen tot bunkermentaliteit, en dat komt de kwaliteit van hun werk niet ten goede. Toch is die missende data erg nodig.
Aantal positieve tests, en totaal aantal tests per etmaal, data uit het NIVEL netwerk, aantal sterfgevallen, demografische verdeling van zieken, gehanteerde rekenmodellen, gemaakte keuzes en verworpen keuzes, escalatiepaden, ziekenhuis en ICU bezetting per ziekenhuis, aantal huidige en historische ziekenhuisopnames, genezingen, maatregelen per veiligheidsregio (er zijn nl verschillen) en landelijk, lopende initiatieven RIVM, voorraden en verbruikssnelheid van tests en alle benodigde medische materialen, etc. etc. Het is er ongetwijfeld allemaal.

Dus hoe kunnen we de helpende hand bieden op vlakken die nu niet prioritair zijn voor het RIVM maar wel belangrijk voor de maatschappij, voor ons? Zoals communicatie en datavoorziening.
Ik snap dat het RIVM volledig in beslag wordt genomen door het werk aan Corona. Hoe kunnen we voldoende mensen regelen die de communicatie-kant komen versterken, zorgen dat informatie / overzichten / data die er ongetwijfeld wel zijn ook publiek worden gedeeld op een herbruikbare manier?
Niet om het RIVM te controleren, maar om anderen in staat te stellen te helpen, en datgene te doen wat in hun eigen context mogelijk is en bijdraagt aan het gezamenlijke doel.
Je zou bijkans een hele afdeling wetenschapscommunicatie en data-savvy mensen naar binnen* kunnen loodsen bij het RIVM met als enige doel ons leken met informatiehonger voldoende te voeden, zodat de RIVM professionals zelf kunnen doen wat nodig is. Ik snap dat het RIVM die mensen nu niet ter beschikking heeft, maar dat leidt geheid tot onrust en wantrouwen onder het publiek juist. Als niet nu dan in de komende weken wel.
(* ‘binnen’ alleen metaforisch natuurlijk, we blijven allemaal remote werken uiteraard. #blijfgewoonthuis)