Datenfreigabe: Warum es Sinn macht, warum es sowieso niemand macht und zu was es führt.
Nach einer Untersuchung von Tenopir et al. (2011) halten 67 % der Befragten den mangelnden Zugriff auf Forschungsergebnisse für ein großes Hindernis für den Wissenschaftsfortschritt. Nur 36 Prozentpunkte der Studienteilnehmer gaben an, dass sie ihre Forschungsergebnisse anderen Wissenschaftlern zur VerfÃ?gung stellten. Die meisten Forschenden wissen zwar, wie wichtig der Datenaustausch ist, aber nur wenige tauschen ihre Informationen aus.
Mit Hilfe von offenen Datensätzen konnten andere Forscher eine Untersuchung mit relativ wenig Mühe nachvollziehen und die Resultate nachprüfen. Harte Forscher würden vor Freude in den Arm genommen, denn offen zugängliche Forschungsergebnisse können eine sozusagen ad hoc Analyse der Zuverlässigkeit und Sachlichkeit erlauben. Darüber hinaus können andere Forscher mit dem selben Datensatz auf neue Befunde stößt.
Synergieeffekte, wohin man schaut - das Fazit ist klar: Austausch macht Forschung effektiver. Auch die aus staatlichen Geldern finanzierten Informationen müssen der Allgemeinheit zugänglich sein. Wird ein Forscher aus dem Geld der Steuerzahler bezahlt, muss er seine Angaben auch jedem zugänglich machen. Interessant ist, dass sowohl das Effizienzargument als auch das Finanzargument eine einzelne Maßnahme, d. h. die gemeinsame Nutzung von Forschungsergebnissen, mit einem gesellschaftlichen Nutzen rechtfertigen.
Die Haeussler et al. (2011) imitierten das Dilemma der klassischen Gefangenen für die Wissenschaft in einer spielerisch-theoretischen Studie: Interessant: Je größer der zu erwartende Ertrag, umso unwahrscheinlicher ist es, daß Informationen ausgetauscht werden. Umgerechnet in Forschungsergebnisse heißt das, je größer ein Forschender den Datenwert schätzt, umso niedriger ist die Chance, dass er sie weitergeben wird - jedenfalls bevor er selbst von den Ergebnissen profitiert hat.
Mit anderen Worten, es gibt ein echtes Problem: Der Gewinn wird normalerweise an einer Veröffentlichung gemessen, nicht an den zugrunde gelegten Angaben. Das bedeutet, dass die eigentlichen Werte erst nach narrativer Verfeinerung erreicht werden. Auch wenn für andere Datenanalytiker ein sauberer Datensatz wahrscheinlich einen größeren Stellenwert hätte als eine Geschichte.
Die gemeinsame Nutzung von Informationen ist daher abhängig von der persönlichen Einschätzung des eigenen Datenwerts; sie hat eine sozioökonomische Komponente. Wissenschafterinnen und Wissenschafter geben nicht an, weil sie kaum etwas davon haben (wie Stanley und Stanley bereits 1988 erklärten). Man könnte nun behaupten, dass ein Forschender die zugrunde gelegten Informationen wenigstens nach seiner eigenen Auswertung, d.h. nach der Veröffentlichung, veröffentlicht und damit anderen zur Kenntnis bringt.
Es werden zu viele Informationen ungenutzt auf CD und Festplatte gespeichert. Weshalb sollte sich ein Naturwissenschaftler die Mühen machen, seine Informationen zu verarbeiten und anderen zur Verfügung zu stellen, wenn es keine allgemeinen Normen in seinem Fachgebiet gibt - keine Qualitätsmerkmale, keine Metadaten-Struktur, kein zentraler Datalogger? Daraus ergibt sich, dass die gemeinsame Nutzung von Informationen auch eine Infrastruktur- und Politikdimension hat.
Vielleicht entfaltet die gemeinsame Nutzung von Informationen erst dann ihr ganzes Potential, wenn entsprechende Normen festgelegt (oder durchgesetzt?) werden. Darüber hinaus gibt es disziplinarische Besonderheiten, wie z.B. Datenschutzbelange bei gesellschaftswissenschaftlichen Befragungen (z.B. kleine Stichproben oder personenbezogene Daten). Auch in diesem Falle hat der Datenaustausch eine moralische Komponente.
Auch bei firmeneigenen Informationen (z.B. im Rahmen der Drittmittelforschung) ergeben sich Fragestellungen zu Verwertungsrechten. Nichtsdestotrotz bin ich der Meinung, dass die Teilnahmebedingungen ein wichtiger Ausgangspunkt für eine so genannte "Kultur des Datenaustausches" sind. Geben Forscher ihre Informationen nicht weiter, weil sie keinen eigenen Nutzen daraus erhoffen ( "Haeusslers et al.") oder weil sie nur einen möglichen Profit verpassen (Stichwort Ideendiebstahl), dann ist eine Belohnungsstruktur für die Forscher notwendig.
Es ist nicht mehr (nur) notwendig, die schriftliche Veröffentlichung zu erfassen, sondern auch die zugrunde gelegten Angaben. Für die wissenschaftlichen Ergebnisse werden Wirkungsmetriken benötigt (siehe hier). Mit der Vorbereitung und Durchführung von Aufträgen sollte der Forscher nicht mehr als mit der Auswertung befasst sein. Führen Datenfreigaben zur Fabrikwissenschaft? Von wem wird gesagt, dass die Person, die Informationen sammelt, auch die Person sein muss, die sie verwendet?
Gibt es genügend Anregungen, nur Informationen zu sammeln und zur VerfÃ?gung zu stellen, dann ist auch die Verknüpfung zwischen dem Hersteller und dem betreffenden Stoff nicht mehr notwendig; dann folgt ein wissenschaftlicher Mitarbeiter seinerseits nicht mehr nur in Teilen, sondern nur noch in Teilen. Solche Vertiefungen sind in allen Bausteinen des Datenzyklus grundsätzlich denkbar: Sammeln von Informationen, Verwaltung und Pflege von Informationen (z.B. Repositorien), Auffindbarkeit von Informationen (z.B. Metasuchmaschinen), Analyse von Informationen und Nutzung von Informationen (Schreiben) - alles in einem modularen Prozess.