Juniorprof. Britta Velten Data Science in der Biologie

Unsere Gruppe arbeitet an der Schnittstelle von Data Science, maschinellem Lernen und Biowissenschaften mit dem Ziel, Computerprogramme und statistische Methoden zu entwickeln, die aus großen molekulare Datensätze ("Omics-Daten") neue biologische Erkenntnisse gewinnen.

Komplexe Versuchsanordnungen und moderne experimentelle Technologien ermöglichen es Forschern heutzutage, den Aufbau von Zellen, Geweben und Organismen und die Regulierung biologischer Prozesse in noch nie da gewesener Auflösung und Umfang zu untersuchen. Dies führt zu einer Vielzahl unterschiedlicher molekularer Daten, die u.a.  Genexpression, Protein-Mengen, epigenetische Profile und Metabolite umfassen. Gemeinsam können diese Daten Aufschluss über die molekulare Heterogenität und die Regulationsmechanismen biologischer Prozesse geben. Grundlegend ist dafür die Integration und Analyse der Daten über verschiedene Technologien, Modellsysteme, Skalen und Umgebungen hinweg. 

Unsere Gruppe verwendet maschinelles Lernen und statistisches Verfahren, um Datenintegration, explorative Datenanalyse, robuste statistische Inferenz und verständliche Visualisierung für moderne Omics-Daten zu ermöglichen. Unser Schwerpunkt liegt auf der Entwicklung von latenten Variablen-Modellen zur Datenintegration und Dimensionsreduktion, der Modellierung von zeitlichen und räumlichen Daten und der Verwendung von kausalen Modellen, um regulatorische Mechanismen aus molekularen Daten aufzudecken. Die von uns entwickelte Software und Methoden sind Open-Source und über GitHub, Bioconductor und PyPI verfügbar.

Weiterführende Informationen zu unserer Forschung sind auf der englischen Version dieser Seite und auf der externen GitHub-Seite verfügbar.