Neue Trainingsplattform für die Analyse von Big Data

Das Projekt Galaxy Europe hat eine Infrastruktur mit Online-Tutorials für Lebenswissenschaftler eingerichtet

Studien zufolge arbeiten mehr als 95 Prozent der Forscherinnen und Forscher in den Lebenswissenschaften schon jetzt mit Big Data oder planen, dies zu tun - aber mehr als 65 Prozent geben an, nur minimale Kenntnisse in Bioinformatik und Statistik zu haben. ,,Vielen fehlt es derzeit an Training und Ausbildung auf diesem Gebiet - das ist der wahre Flaschenhals, der eine  breitere Nutzung datenwissenschaftlicher Methoden erschwert", sagt der Bioinformatiker Dr. Björn Grüning von der Universität Freiburg. Er koordiniert das Projekt Galaxy Europe, das Abhilfe schaffen will: mit interaktiven, Community-basierten und online frei verfügbaren Tutorials für die Datenanalyse in den Lebenswissenschaften. Die beteiligten Forscher haben ihr Vorhaben im Fachjournal ,,Cell Systems" vorgestellt.

Galaxy ist eine Open-Source-Plattform für die Analyse von Big Data in den Lebenswissenschaften, die Wissenschaftlerinnen und Wissenschaftler über einen Internetbrowser benutzen können. Kenntnisse im Programmieren sind dafür nicht erforderlich: Alle Einstellungen lassen sich über eine grafisch aufbereitete Oberfläche vornehmen. Um anderen Forschern den Einstieg zu erleichtern, hat das Galaxy-Team eine Reihe von Tutorials aufgesetzt: Anhand einer ,,Forschungsstory", basierend auf realen, aber vereinfachten Datensätzen, lernen die Nutzerinnen und Nutzer Schritt für Schritt, die Analysewerkzeuge von Galaxy gewinnbringend einzusetzen. Außerdem vermitteln alle Tutorials grundlegende Kenntnisse in Bioinformatik und Statistik. ,,Wir wollen vermeiden, dass die Forscher die Software nur wie eine Black Box anwenden, ohne zu verstehen, welche Methoden diese Werkzeuge anwenden und was sie leisten können", erklärt Grüning. Ziel ist darüber hinaus, dass Wissenschaftler weltweit daran mitwirken, das Angebot an Tutorials stetig zu erweitern - der Community-Ansatz und die Galaxy-Plattform machen es möglich: Mehr als 60 Forscher aus der ganzen Welt haben bisher schon zu dem Lernangebot beigetragen.

Galaxy wurde an der US-amerikanischen Penn State University initiiert und an der Universität Freiburg im Sonderforschungsbereich ,,Medizinische Epigenetik" sowie als Teil des Deutschen Netzwerks für Bioinformatik-Infrastruktur (de.NBI) weiterentwickelt. Der Europa-Server des Projekts, für den das Team um Björn Grüning aus der Arbeitsgruppe von Rolf Backofen am Institut für Informatik die Federführung innehat, befindet sich im Rechenzentrum der Universität Freiburg.

Originalveröffentlichung Bérénice Batut, Saskia Hiltemann, Andrea Bagnacani et al. (2018):  Community-driven data analysis training for biology. In: Cell Systems. doi.org/10.1016/j.ce­ls.2018.05.012