Datenmanagement und datenintensives Rechnen - Prof. Achim Streit
-
Als einer der Direktoren des Steinbuch Centre for Computing (SCC) des KIT erforscht und entwickelt der Informatiker mit seinem Team anwendungsorientierte Lösungen für das Forschungsdatenmanagement und datenintensive Rechnen, unter anderem für Material- und Klimaforschung sowie Teilchenphysik.
Große Daten sicher und verteilt managen – und aus diesen Wissen generieren
„In Wissenschaft, Wirtschaft und Gesellschaft entstehen stetig mehr und mehr Daten. Unser Ziel ist es, diese geeignet zu verwalten und zu speichern“, sagt Achim Streit. Am SCC arbeitet er an Methoden und Technologien zum verteilten und sicheren Umgang mit Forschungsdaten, Metadaten, verteilten Authentifizierungs- und Autorisierungs-Infrastrukturen (AAI) bis hin zur Datenarchivierung. Diese Lösungen setzt das SCC zusammen mit nationalen und internationalen Partnern in der Praxis ein. Zudem betreibt das SCC mit GridKa, dem deutschen Daten- und Analysezentrum für die Teilchen- und Astroteilchenphysik und Tier 1-Zentrum des Worldwide LHC Computing Grid eines der größten wissenschaftlichen Datenzentren weltweit.
„Mit dem Speichern von Daten allein dürfen wir uns aber nicht zufriedengeben. Aus Daten muss auch Wissen extrahiert werden können“, betont der Informatiker. Deshalb arbeiten die Forschenden am SCC auch an Lösungen zur Datenanalyse und an skalierbaren Methoden der Künstlichen Intelligenz (KI). Weitere Themen sind das Quantum Machine Learning, also die Verbindung von Ansätzen des maschinellen Lernens und der Quanteninformationsverarbeitung, das effiziente Nutzen verteilter Rechenressourcen sowie die Ablauf- und Ressourcenplanung (Job-Scheduling). Die entstehenden Verfahren und Anwendungen werden dabei stets unter Aspekten der Skalierbarkeit, der Recheneffizienz und eines möglichst geringen Energieverbrauchs auf heterogenen Rechensystemen entwickelt, zu denen auch Grafikprozessoren, kurz GPUs, und Quantencomputer gehören.
Viele dieser Forschungsaktivitäten erfolgen in Zusammenarbeit mit anderen Disziplinen wie beispielsweise der Teilchenphysik, der Klima- und Umweltforschung, der Materialforschung, der Energieforschung bis hin zu den Geisteswissenschaften. „Die dabei entstehenden Software-Lösungen und Datensätze werden im Sinne offener und transparenter Wissenschaft frei zugänglich veröffentlicht“, so Streit. Bei der Entwicklung dieser Software setzen die Forschenden stark auf Methoden des Research Software Engineering.
Diese Forschung des SCC ist Teil des Helmholtz-Programms „Engineering Digital Futures“ sowie der Helmholtz-Plattformen zu Metadaten (HMC), zu Künstlicher Intelligenz (Helmholtz.AI) und zu föderierten IT-Diensten (HIFIS). Beim Aufbau der Nationalen Forschungsdateninfrastruktur (NFDI) ist das SCC unter anderem in den Fachkonsortien zu den Ingenieurwissenschaften (NFDI4Ing), den Materialwissenschaften (NFDI-MatWerk) sowie der Teilchenphysik (PUNCH4NFDI) stark engagiert. Im Fokus stehen dabei die Themen Metadaten, AAI und Anbindung von Speicherdiensten. Auch am Aufbau der European Open Science Cloud (EOSC) ist das SCC aktiv beteiligt, unter anderem zum Etablieren der notwendigen Basisdienste, zu KI-as-a-Service, zum Thema digitale Zwillinge und bei der Weiterbildung.
Achim Streit ist seit 2010 einer der Direktoren des SCC und hat eine Professur für verteilte und parallele Hochleistungssysteme an der KIT-Fakultät für Informatik inne. Er ist Vorstandsmitglied im Helmholtz-Programm „Engineering Digital Futures“ und wissenschaftlicher Sprecher des Anteils des KIT in diesem Programm sowie Mit-Initiator der Helmholtz-weiten Information & Data Science Akademie (HIDA). Außerdem vertritt er das KIT in der EOSC. (red)
Der Presseservice des KIT stellt gerne den Kontakt zwischen den Medien und Prof. Achim Streit her.
Fotonachweis:
Foto Festplatten: SCC, KIT
Porträt Prof. Achim Streit, SCC, KIT: CERN