Het Maastricht Universitair Medisch Centrum+ / UM vertegenwoordigt
Nederland in de publicatie in Nature Genetics in de personen van
prof.dr. Jos Kleinjans, voorzitter van de vakgroep Toxicogenomics, en zijn
collega dr. Chris Evelo, voorzitter van de vakgroep Bioinformatica.
In totaal onderschrijven 50 vertegenwoordigers van 37 onderzoeksgroepen uit
de hele wereld het artikel Towards interoperable bioscience data dat
zojuist is gepubliceerd.
Big Data
Het (sneller, beter en gecombineerd kunnen
analyseren van omvangrijke sets data zal in toenemende mate een belangrijke
succes factor zijn voor baanbrekend biologisch onderzoek. Daarnaast zal het
ten grondslag liggen aan nieuwe innovatie en groei van productiviteit,
blijkt uit onderzoek Big data: The next frontier for innovation, competition,
and productivity van MGI-en McKinsey's Business Technology
Office.
Probleem is a) dat deze gigantische hoeveelheid data toegankelijk moeten
worden gemaakt en b) dat data decentraal over de hele wereld zijn en
worden opgeslagen.
Data-sharing
De visie waarover de biowetenschappers
van 37 onderzoeksgroepen het eens zijn geworden, is dat deze 'Big Data' zo
snel mogelijk moeten worden gestandaardiseerd, geïntegreerd en toegankelijk
gemaakt. Die standaardisatie - waarvoor men de ISA-tab standaard wil
gebruiken - moet niet alleen bestaan uit bijvoorbeeld de dna-informatie die
benodigd is voor een specifiek onderzoek, maar ook uit metadata die
beschrijft hoe en waarom die data verkregen is en wat er verder bekend over
de onderzoeksobjecten. Die metadata geven bovendien aan waar de ruwe data
zijn opgeslagen en hoe die toegankelijk zijn.
Kleinjans: "Wij zijn hierbij betrokken geraakt door het EU project
CarcinoGENOMICS waarin we een alternatief
proberen te vinden voor proefdieren voor het testen van
kankerverwekkende stoffen. Hierbij is genomics de kerntechnologie,
waarmee zeer veel data zijn geproduceerd omtrent de reactie van cellen
op kankerverwekkende stoffen. Voorwaarde voor succes van dit soort
initiatieven is echter data-sharing. Daarvoor moeten wetenschappers
vertrouwen hebben in de kwaliteit van de data-beschrijvingen en zijn er
voorbeelden nodig van zogeheten open source tools die met die data om
kunnen gaan; zonder tools heeft het nog geen zin. Samen met het
European Bioinformatics Institute hebben we een
eerste toolset ontwikkeld, en mede hieruit is de ISA-infrastructuur
ontstaan."
Evelo: "Wat ISA vooral mogelijk maakt is het opnieuw gebruiken van data en
het vinden van elkaar aanvullende studies. Je zou bijvoorbeeld alle studies
waarin het effect van vet voedsel op de ontwikkeling van diabetes wordt
bekeken kunnen vinden en meteen de bijbehorende resultaten kunnen
downloaden. Dat maakt data waardevoller, en maakt het mogelijk verbanden te
vinden die in een enkele data set niet boven water komen"
Omdat het beschikbaar maken van data alleen werkt als zoveel mogelijk
instituten mee doen is het belangrijk dat dit artikel en het voorstel
daarin wordt gedragen door een zo breed mogelijke groep."
Techniek van de toekomst
Dat 'Big Data' geen hobby is
van een paar wetenschappers blijkt uit de Digital agenda for Europe waar
eurocommissaris Kroes veel geld voor uittrekt. "Daardoor is de hardware
voor informatica inmiddels gerealiseerd, nu nog de applicaties die nodig
zijn om deze warehouses te vullen", aldus Kleinjans, waarbij hij hamert
op kwaliteit, want "Rubbish in rubbish out".
Hij voorziet een belangrijke rol voor de integratie van Big Data met name
in verband met de opkomende sequencing technologie in de voorspellende
geneeskunde. "Sequencing is de techniek van de toekomst, ook omdat het veel
goedkoper wordt: kostte tien jaar geleden het sequencen van het DNA van een
mens 7 miljard dollar, binnenkort kan dat al voor 1000 dollar."
"Juist die grote hoeveelheden, vaak erg kostbare data maakt dat het
belangrijk is de beschrijving van die data centraal beschikbaar te hebben",
aldus Evelo. "Als je bijvoorbeeld ook weet of sequentie data afkomstig is
van een diabetes patiënt is kun je die informatie en daarmee ook de
sequentie voor meer zaken gebruiken."