Medizinische Bioinformatik mit Schwerpunkt auf Patientennahe Datenerfassung

Prof. Dr. Alexander Schliep ist seit dem 01. Oktober 2022 FGW-Professor für Medizinische Bioinformatik mit dem Schwerpunkt patientenorientierte Datenerfassung an der Brandenburgischen Technischen Universität Cottbus-Senftenberg (BTU).

Große Datenmengen werden in vielen Disziplinen erhoben, oft mit höchst unterschiedlichen Formaten, die bioinformatisch bearbeitet werden müssen. Dazu ist es meist notwendig, neue Tools zu entwickeln, die für den Datensatz und die konkrete Fragestellung die bestmögliche Antwort liefern.

Darüber hinaus wird ein Schwerpunkt dieser Professur die Entwicklung neuer Techniken wie mobile Diagnostik oder vernetzte Versorgung chronisch kranker Menschen sowie die bias-freie Evaluation dieser neuen Techniken sein.

Prof. Dr. Alexander Schliep
Prof. Dr. Alexander Schliep
Leitung der Professur für Medizinische Bioinformatik mit Schwerpunkt auf Patientennahe Datenerfassung
Tel.: +49 (0)355 5818 721

Das SchliepLAB ist Teil der Fakultät für Gesundheitswissenschaften Brandenburg und befindet sich an der Brandenburgischen Technischen Universität Cottbus-Senftenberg. Ein Teil der Gruppe ist an der Fakultät für Informatik und Ingenieurwissenschaften angesiedelt, die eine gemeinsame Fakultät der Universität Göteborg und der Chalmers University of Technology ist.

Eine Liste der laufenden und abgeschlossenen Forschungsprojekte finden Sie unter https://schlieplab.org/Research/, eine Liste der Veröffentlichungen unter https://schlieplab.org/Publications/ und eine Liste der Softwarepakete unter https://schlieplab.org/Software/.

Forschungsschwerpunkte

AI für das Design von Oligonukleotid-Therapeutika

Insbesondere für Antisense-Oligonukleotide (ASO), die durch RNAse H1-mediated Knockdown wirken, sind Bindungsenergien und Kinetik von ASO-mRNA-Duplexen entscheidend für die Vorhersage von Wirksamkeit und Sicherheit. Wir sagen Bindungsenergien anhand von Sequenzen voraus, untersuchen die Kinetik der ASO-Reaktionen, um den Entwurfsprozess von ASO-Medikamenten vorhersehbarer zu machen, und kombinieren in Kooperationsprojekten Molekulardynamik und künstliche Intelligenz, um Vorhersagemodelle für eine breitere Palette von Nukleotidmodifikationen zu erweitern. Unsere federated, privacy preserving Lernmethoden ermöglichen auch ohne Austausch von Daten ML-Modelle für die Vorhersage von Bindungsenergien zu lernen.

ML für pan-genomische Graphen

Pan-Genom-Graphen bieten einen prinzipiellen Ansatz für den Umgang mit strukturellen Variationen und, allgemein, dem hohen Grad an Variationen zwischen individuellen Genomen. ML auf Pan-Genom-Graphen wird es ermöglichen, Vorhersage- und Regressionsaufgaben für verschiedene Populationen zu bewältigen, einschließlich Größen, die für Oligonukleotid-Therapeutika relevant sind, wie Transkriptionsgeschwindigkeit oder DNA-Accessibility, sowie klinisch relevante Variablen.

ML und Algorithmik für Sequenzierdaten

Die von experimentellen Hochdurchsatzplattformen wie dem High-Throughput Sequencing (HTS) erzeugten Daten stellen eine rechnerische Herausforderung dar, insbesondere wenn fortschrittliche statistische Ansätze wie Bayes’sche Methoden zur Analyse verwendet werden. In der Vergangenheit haben wir einen komprimierenden Genomik-Ansatz entwickelt, der vom Big Data to Knowledge Program (BD2K) der NIH finanziert wurde, Wavelet-Kompression in Bayes’schen HMMs zur Erkennung von Kopienzahlvarianten eingesetzt und den Nutzen statistischer ML-Modelle, die Genome repräsentieren – Markov-Ketten variabler Länge – durch schnellere Lernalgorithmen erheblich verbessert. Dies ermöglicht z. B. alignementfreie Genomvergleiche aus Rohdaten.

Lehre

Computational Thinking ist heute eine Grundvoraussetzung für fast alle Disziplinen. Die Vermittlung von algorithmischen Ideen kann von Software-Tools stark profitieren. Wir entwickeln Animationssysteme für Graphenalgorithmen, die auf dem Desktop, als Web-App und bald auch als iOS-App verfügbar sind; CATBox ist ein Springer-Lehrbuch, das Gato verwendet. Mit unserer Hidden Markov Model-Bibliothek können sich die Lernenden auf die Lösung spannender bioinformatischer Probleme konzentrieren.

Wintersemester 2024/25

Computing at Scale in Machine Learning: Distributed computing and algorithmic approaches (Modul: 14038)

Learning Outcomes
Students will obtain an overview on how to solve large-scale computational problems in data science and machine learning using a) parallel approaches from multi-threaded computation on individual machines to implicit parallelism frameworks on compute clusters and b) algorithms and data structures supporting efficient exact or approximate computation with massive data sets in and out of core. In particular they will learn how to analyze relevant probabilistic data structures and algorithms and select and implement appropriate computational approaches for large-scale problems.

Contents
The focus will be on four fundamental problem areas:

  • A review of memory-compute co-location and its impact on big data computations.
  • Solving Machine Learning (ML) work loads using explicit parallelism, specifically multi-threaded computation on an individual machine.
  • Introduction of implicit parallelism programming models as implemented for example in MapReduce, Spark and Ray and their application in ML.
  • Probabilistic algorithms such as sketching algorithms (incl. CountMinSketch, HyperLogLog) or Bloom filters.
  • Implementing ML methods using index data structures such as suffix or kd-trees.

Recommended Prerequisites

  • Introduction to machine learning at Master’s level. Advanced knowledge of programming in Python and the Linux command line. 
LectureExercise
ThursdayThursday
15:30 – 17:0017:30 – 19:00
Central Campus, LG 1A, HS 1Central Campus, LG 1A, HS 1

Detailed information for participants is available at <<coming soon>>


Introduction to Bioinformatics (Modul: <<coming soon>>)

Learning Outcomes
After successfully completing the module, students will have acquired an overview of the fundamentals of bioinformatics. This includes an introduction to relevant molecular processes, scientific instruments to investigate these processes, and the data generated by them. For central computational problems, students will be able to discuss advantages and disadvantages of statistical and basic algorithmic approaches, respectively adapt them to specific biological questions. Students will be able to analyze specific biological data using appropriate software libraries for Python.

Contents
The focus will be on the basics of the following areas:

  • An introduction to molecular biology including relevant scientific instruments and the Omics-data generated by them.
  • Pair-wise and multiple sequence alignments, seed-and-extend approaches, and genome indexes
  • Evolutionary models and phylogenetic trees
  • Signals in sequences: identification of motifs
  • Assembly of genomes and transcriptomes
  • Gene expression analysis

Recommended Prerequisites
Good knowledge of discrete probability, algorithms and data structures at the undergraduate level. Advanced knowledge of programming in Python and the Linux command line. 

ExerciseLecture
FridayFriday
9:15 – 10:4511:30 – 13:00
Campus Sachsendorf, building 9, room 9.122Campus Sachsendorf, building 9, room 9.122

Detailed information available for participants at <<coming soon>>


Bioinformatics (Modul: 13866)

Seminar
Friday
13:45 – 15:15
Sachsendorf Campus, LG 9, HS 9.122

Detailed information for participants is available at <<coming soon>>


Research Module in Artificial Intelligence (Modul: 14060)

Appointment by arrangement in Sachsendorf


Oberseminar Medizinische Bioinformatik (Modul: 13600)

Appointment by arrangement in Sachsendorf


A list of current and prior offered courses and seminars can be found at https://schlieplab.org/Teaching/

Katharina Mansfeld
Katharina Mansfeld
Assistentin
Tel.: +49 (0)355 5818 720
Nathalie Gocht, M. Sc.
Nathalie Gocht, M. Sc.
Wissenschaftliche Mitarbeiterin
Tel.: +49 (0)355 5818 373
Aleksandra Khatova, M. Sc.
Aleksandra Khatova, M. Sc.
Wissenschaftliche Mitarbeiterin
Tel.: +49 (0)355 5818 723
Gemeinsame Fakultät
Der Universität Potsdam, der Medizinischen Hochschule Brandenburg Theodor Fontane und der Brandenburgischen Technischen Universität Cottbus-Senftenberg