Open Data en ‘The Long Tail’

Bij de start van de app-wedstrijd  ‘Innoveren met Open Data‘ vertelde lector Bert Mulder over open data in Amerika.* Op data.gov zijn ruim 390.000 datasets te vinden.

Ook vind je daar een aantal Apps. In totaal zijn er 1.467 Apps beschikbaar. Het gaat om Apps van de overheid, apps die door burgers zijn ontwikkeld en ‘mobiele’ Apps. Het is me niet duidelijk of alle Apps gemaakt zijn op basis van open data, maar laten we daar voor het gemak maar even vanuit gaan.

Wanneer ik het aantal Apps vergelijk met het aantal datasets kom ik tot een opmerkelijke conclusie. Tegenover iedere App zijn er ruim 265 datasets beschikbaar. Je zou kunnen stellen dat de Amerikaanse overheid 1 op 265 loopt. Voor iedere 265 datasets is er één App met overheidsinformatie.

Long tail

Hier zie ik een ‘long tail‘ in. Een klein aantal van de 390.000 datasets is zeer bruikbaar voor het maken van een App. Hierbij denk ik aan apps die kaarten combineren met data die een geo-tag heeft. De vraag naar deze datasets is groot: ze worden veel gebruikt in Apps.

Daar staan relatief veel datasets tegenover die niet bruikbaar zijn in een App. Dan denk ik aan een set als ‘Pipeline Annual Data – 1970 – 1989 Transmission Company Operator Annual Reports (Zip)‘. (Wat moet je er mee?)

Weinig apps

Eén app per 265 datasets vind ik wat weinig. Zeker voor een groot land als de U.S. of A. Als ik naar data.overheid.nl kijk dan zie ik daar op dit moment ‘slechts’ zo’n 130 datasets. Wanneer we het net zo goed doen als de U.S. of A. dan zou er nu 0,5 app zijn die op basis van open overheidsdata is gemaakt… (Overigens is open data niet hetzelfde als apps, maar dat terzijde.)

App-wedstrijd als tactiek

Gelukkig zijn het er veel meer, kijk maar naar het aantal inzendingen voor de wedstrijd ‘Apps for Noord-Holland‘. Dat zijn er ruim 20! De tactiek waarbij app-wedstrijden worden uitgeschreven lijkt op de korte termijn effect te hebben. Dit levert een groot aantal apps op. Ook de wedstrijd ‘Innoveren met Open Data’ zal waarschijnlijk tientallen apps opleveren.

Maar ik ben wel bang voor de originaliteit van de apps. Er is immers maar een beperkte verzameling datasets. Dit beperkt het aantal mogelijke combinaties van datasets en daarmee ook de mogelijkheid om innovatieve apps te maken op basis van die datasets (Innovatie is immers niets meer dan het maken van nieuwe en onverwachte combinaties. In dit geval kunnen dat combinaties van datasets zijn, te realiseren via een app.)

Innoveren met open data

Om écht te innoveren met open data is het nodig het aantal mogelijke combinaties dramatisch te vergroten. Met het grote aantal datasets op data.gov is een ontzettende hoeveelheid combinaties mogelijk. De kans is groot dat daar een paar zeer waardevolle en bruikbare combinaties tussen zitten.

Je voelt het al: dat geldt nog niet voor data.overheid.nl. Onze ‘tail’ is nog niet erg ‘long’… Maar als we in 2012 écht willen innoveren met open data dan moet het aantal datasets flink stijgen. Daarom hoop ik dat de overheid in 2012 flink werk gaat maken van het beschikbaar stellen van data als open data. Op naar de 10.000 datasets per 31 december?

* Zie hier het verslag van de startbijeenkomst ‘Innoveren met Open Data’ in Storify.

Share

2 gedachten over “Open Data en ‘The Long Tail’

Reacties plaatsen niet mogelijk.