Iedereen hongert naar informatie, en naarmate we langer thuis zitten waarschijnlijk ook naar meer nuttige dingen om te doen. Data en informatie kan bij dat laatste helpen: om te zien waar je nuttig iets toe kunt voegen. Hoeveel materiaal is er beschikbaar in Nederland, en wat dreigt op te raken in een regio? Hoeveel tests worden er gedaan, hoeveel zijn er op voorraad? Welke maatregelen worden er precies genomen? Want het RIVM, GGD’s en zorginstellingen doen veel meer dan we kunnen zien. Het antwoord op die vragen is niet beschikbaar. En dus moet je of aannemen dat ‘de instanties’ het allemaal al geregeld hebben (en dat is niet waarschijnlijk want ook voor hen is een nieuwe en complexe situatie), of aannemen dat ze je bewust ongeïnformeerd houden en je niet als zelfstandige actor in deze situatie zien (en ook dat is niet waarschijnlijk, want onze medewerking is noodzakelijk).

Zelfs basale gegevens als het aantal positief getesten, overledenen, en ziekenhuisopnames, zijn niet beschikbaar als data. De cijfers worden wel genoemd in de dagelijkse nieuwsbulletins van het RIVM, maar bijvoorbeeld t.a.v. het aantal tests en ziekenhuisverblijven maar mondjesmaat en inconsistent. Het RIVM heeft wel een data site maar daar is het akelig stil.

Geen relevante zoekresultaten op data.rivm.nl

Ik maak sinds eind februari een excelblaadje, waarin ik elke dag een nieuwe regel toevoeg. Om daar uit af te leiden of we nog op de exponentiële curve zitten, of we in de buurt blijven van wat andere landen doormaken of daar vanaf wijken, en hoe dit zich verhoudt tot de cijfers over het aantal ziekenhuis- en IC-bedden. Raar natuurlijk dat die gegevens, die deels wel in de nieuwsberichten op de RIVM site staan, niet ook als data op diezelfde site te vinden zijn.

Door deze data niet standaard te delen bereik je 3 ongewenste effecten:

  • Je bent niet zelf de betrouwbaarste bron van data, iedereen die iets wil weten is afhankelijk van materiaal uit tweede (of erger) hand.
  • Het is onmogelijk om snel na te gaan of een artikel dat je leest zich baseert op kloppende brongegevens
  • Data en informatie is een middel om anderen in staat te stellen in actie te komen op manieren die het werk van het RIVM en de zorginstellingen ondersteunen. Gebrek aan informatie doemt ons op zijn best tot stilzitten, op zijn ergst tot ongeïnformeerde en schadelijke keuzes.

Die laatste van de drie is het belangrijkst. En dus is het nodig vragen aan het RIVM te stellen naar die gegevens. Dergelijke vragen worden snel als lastig, kritisch en storend ervaren. Het RIVM is volledig bezet met het bestrijden van de epidemie, en dan is elke afleiding storend. Maar in een crisis is zo groot mogelijk transparantie geven juist van belang. Dan hebben wij allemaal meer informatie om onze eigen beslissingen op te baseren, en beter te snappen waar we aan toe zijn. Die transparantie is niet alleen een taak van het RIVM, maar ook van de veiligheidsregio’s. Die veiligheidsregio’s tekenen de verordeningen waarin de beperkingen worden vastgelegd die we nu hebben. Het bestuur van die regio’s zijn de burgemeesters van de gemeenten die er binnen vallen. Die burgemeesters dienen een grotere rol te hebben in de communicatie naar hun inwoners. Niet alleen mondelinge communicatie, maar ook de feiten over de eigen regio gevat in data.

Vragen stellen aan het RIVM op dit moment werkt storend voor het RIVM, leidt af in een tijd van grote drukte en stress. Criticasters leiden alleen tot bunkermentaliteit, en dat komt de kwaliteit van hun werk niet ten goede. Toch is die missende data erg nodig.
Aantal positieve tests, en totaal aantal tests per etmaal, data uit het NIVEL netwerk, aantal sterfgevallen, demografische verdeling van zieken, gehanteerde rekenmodellen, gemaakte keuzes en verworpen keuzes, escalatiepaden, ziekenhuis en ICU bezetting per ziekenhuis, aantal huidige en historische ziekenhuisopnames, genezingen, maatregelen per veiligheidsregio (er zijn nl verschillen) en landelijk, lopende initiatieven RIVM, voorraden en verbruikssnelheid van tests en alle benodigde medische materialen, etc. etc. Het is er ongetwijfeld allemaal.

Dus hoe kunnen we de helpende hand bieden op vlakken die nu niet prioritair zijn voor het RIVM maar wel belangrijk voor de maatschappij, voor ons? Zoals communicatie en datavoorziening.
Ik snap dat het RIVM volledig in beslag wordt genomen door het werk aan Corona. Hoe kunnen we voldoende mensen regelen die de communicatie-kant komen versterken, zorgen dat informatie / overzichten / data die er ongetwijfeld wel zijn ook publiek worden gedeeld op een herbruikbare manier?
Niet om het RIVM te controleren, maar om anderen in staat te stellen te helpen, en datgene te doen wat in hun eigen context mogelijk is en bijdraagt aan het gezamenlijke doel.
Je zou bijkans een hele afdeling wetenschapscommunicatie en data-savvy mensen naar binnen* kunnen loodsen bij het RIVM met als enige doel ons leken met informatiehonger voldoende te voeden, zodat de RIVM professionals zelf kunnen doen wat nodig is. Ik snap dat het RIVM die mensen nu niet ter beschikking heeft, maar dat leidt geheid tot onrust en wantrouwen onder het publiek juist. Als niet nu dan in de komende weken wel.
(* ‘binnen’ alleen metaforisch natuurlijk, we blijven allemaal remote werken uiteraard. #blijfgewoonthuis)

UntitledProbably the top left gives the most realistic information. Image by Brooke Novak, license CC BY

An organisation that says it wants to work data driven as well as sees ethics as a key design ingredient, needs to take a very close look imho at how they set KPI’s and other indicators. I recently came across an organisation that says those first two things, but whose process of setting indicators looks to have been left as a naive exercise to internal teams.

To begin with, indicators easily become their own goals, and people will start gaming the measurement system to attain the set targets. (Think of call centers picking up the phone and then disconnecting, because they are scored on the number of calls answered within 3 rings, but the length of calls isn’t checked for those picked up)

Measurement also isn’t neutral. It’s an expression of values, regardless of whether you articulated your values. When you measure the number of traffic deaths for instance as an indicator for road safety, but not wounded or accidents as such, nor their location, you’ll end up minimising traffic deaths but not maximising road safety. Because the absence of deaths isn’t the presence of road safety. Deaths is just one, albeit the most irreparable one, expression of the consequences of unsafety. Different measurements lead to different real life actions and outcomes.

Gauges‘Gauges’ by Adam Kent, license CC BY

When you set indicators it is needed to evaluate what they cover, and more importantly what they don’t cover. To check if the overall set of indicators is balanced, where some indicators by definition deteriorate when others improve (so balance needs to be sought). To check if assumptions behind indicators have been expressed and when needed dealt with.

Otherwise you are bound to end up with blind spots, lack of balance, and potential injustices. Defined indicators also determine what data gets collected, and thus what your playing field is when you have a ‘data driven’ way of working. That way any blind spot, lack of balance and injustice will end up even more profoundly in your decisions. Because where indicators mostly look back in time at output, data driven use of the data underlying those indicators actively determines actions and thus (part of) future output, turning your indicators in a much more direct and sometimes even automated feedback loop.

CompassOnly if you’ve deliberately defined your true north, can you use your measurements to determine direction of your next steps. ‘Compass’ by Anthony, license CC BY ND

To me there seems to be something fundamentally wrong with plans I come across where companies would pay people for access to their personal data. This is not a well articulated thing, it just feels like the entire framing of the issue is off, so the next paragraphs are a first attempt to jot down a few notions.

To me it looks very much like a projection by companies on people of what companies themselves would do: treating data as an asset you own outright and then charging for access. So that those companies can keep doing what they were doing with data about you. It doesn’t strike me as taking the person behind that data as the starting point, nor their interests. The starting point of any line of reasoning needs to be the person the data is about, not the entity intending to use the data.

Those plans make data release, or consent for using it, fully transactional. There are several things intuitively wrong with this.

One thing it does is put everything in the context of single transactions between individuals like you and me, and the company wanting to use data about you. That seems to be an active attempt to distract from the notion that there’s power in numbers. Reducing it to me dealing with a company, and you dealing with them separately makes it less likely groups of people will act in concert. It also distracts from the huge power difference between me selling some data attributes to some corp on one side, and that corp amassing those attributes over wide swaths of the population on the other.

Another thing is it implies that the value is in the data you likely think of as yours, your date of birth, residence, some conscious preferences, type of car you drive, health care issues, finances etc. But a lot of value is in data you actually don’t have about you but create all the time: your behaviour over time, clicks on a site, reading speed and pauses in an e-book, minutes watched in a movie, engagement with online videos, the cell towers your phone pinged, the logs about your driving style of your car’s computer, likes etc. It’s not that the data you’ll think of as your own is without value, but that it feels like the magician wants you to focus on the flower in his left hand, so you don’t notice what he does with his right hand.
On top of that it also means that whatever they offer to pay you will be too cheap: your data is never worth much in itself, only in aggregate. Offering to pay on individual transaction basis is an escape for companies, not an emancipation of citizens.

One more element is the suggestion that once such a transaction has taken place everything is ok, all rights have been transferred (even if limited to a specific context and use case) and that all obligations have been met. It strikes me as extremely reductionist. When it comes to copyright authors can transfer some rights, but usually not their moral rights to their work. I feel something similar is at play here. Moral rights attached to data that describes a person, which can’t be transferred when data is transacted. Is it ok to manipulate you into a specific bubble and influence how you vote, if they paid you first for the type of stuff they needed to be able to do that to you? The EU GDPR I think takes that approach too, taking moral rights into account. It’s not about ownership of data per se, but the rights I have if your data describes me, regardless of whether it was collected with consent.

The whole ownership notion is difficult to me in itself. As stated above, a lot of data about me is not necessarily data I am aware of creating or ‘having’, and likely don’t see a need for to collect about myself. Unless paying me is meant as incentive to start collecting stuff about me for the sole purpose of selling it to a company, who then doesn’t need my consent nor make the effort to collect it about me themselves. There are other instances where me being the only one able to determine to share some data or withhold it mean risks or negative impact for others. It’s why cadastral records and company beneficial ownership records are public. So you can verify that the house or company I’m trying to sell you is mine to sell, who else has a stake or claim on the same asset, and to what amount. Similar cases might be made for new and closely guarded data, such as DNA profiles. Is it your sole individual right to keep those data closed, or has society a reasonable claim to it, for instance in the search for the cure for cancer? All that to say, that seeing data as a mere commodity is a very limited take, and that ownership of data isn’t a clear cut thing. Because of its content, as well as its provenance. And because it is digital data, meaning it has non-rivalrous and non-excludable characteristics, making it akin to a public good. There is definitely a communal and network side to holding, sharing and processing data, currently conveniently ignored in discussions about data ownership.

In short talking about paying for personal data and data lockers under my control seem to be a framing that presents data issues as straightforward but doesn’t solve any of data’s ethical aspects, just pretends that it’s taken care of. So that things may continue as usual. And that’s even before looking into the potential unintended consequences of payments.