Internationales Team mit KIT-Beteiligung entwickelt Datensatz um mit Methoden des Maschinellen Lernens schnellere Berechnungen von Klimawandelszenarien zu ermöglichen
Der Klimawandel stellt eine erhebliche Herausforderung für Mensch und Umwelt dar. Das Verständnis von zukünftigen Klimaszenarien ist für die Abschwächung des Klimawandels und die Anpassung an ihn unerlässlich. Um konkrete Maßnahmen einzuleiten, verlassen sich politische Entscheidungsträger in hohem Maße auf Zukunftssimulationen unseres Klimas. Diese Modelle simulieren das Klima unter verschiedenen Szenarien, basierend auf Annahmen über die zukünftige globale gesellschaftliche und industrielle Entwicklung und den damit verbundenen Ausstößen von Treibhausgasen.
Dabei stellen sich allerdings einige Herausforderungen. Zum einen sind Klimamodelle extrem rechenaufwändig, was die Anzahl der möglichen Szenarien die simuliert werden können stark einschränkt. In diesem Zusammenhang bietet das Maschinelle Lernen große Möglichkeiten, weil einmal trainiert solche Modelle sehr schnell und relativ kostengünstig Vorhersagen treffen können. Allerdings konzentrieren sich diese Methoden bis jetzt vor allem auf aktuelle Wetterdaten oder auf Daten aus den letzten Jahrzehnten (z.B. sogenannte Reanalysedaten). Mit diesen Daten kann man allerdings nur ungenügend das zukünftige Klima abbilden, gerade wenn man auch die Aspekte des Klimawandels verlässlich einbeziehen möchte.
Um diesen Prozess zu verbessern hat ein Team von Wissenschaftlerinnen und Wissenschaftlern aus Deutschland, Israel, Kanada und den USA nun einen Datensatz namens „ClimateSet“ entwickelt. Das ClimateSet-Projekt zielt darauf ab, einen groß angelegten und standardisierten Datensatz von Klimamodellen für die Forschung im Bereich des Maschinellen Lernens bereitzustellen.
"Klimamodelldaten sind aufgrund ihrer enormen Dimensionalität, Komplexität und Relevanz für die Welt so etwas wie eine Traumspielwiese und gleichzeitig eine ultimative Herausforderung für Entwickler von ML-Modellen. Doch um dorthin zu gelangen, musste man sich bisher durch ein weltweites Labyrinth aus Unstimmigkeiten kämpfen. ClimateSet soll die Abkürzung für die ML-Gemeinschaft sein - oder anders gesagt, eine schnelle Möglichkeit, sich auf die Klimakrise vorzubereiten," stellt Teammitglied Charlotte Lange fest, die am Mila Quebec AI Institute sowie an der Universität Osnabrück forscht.
Schematische Übersicht Climate-Set-Projekt (Bild: Julia Kaltenborn)
ClimateSet enthält Inputs und Outputs von 36 Klimamodellen, die es Forscherinnen und Forschern ermöglichen, ML-Modelle für verschiedene klimabezogene Aufgaben zu entwickeln und zu bewerten. Ähnliche Projekte hatten bisher nur 1-2 Modelle einbezogen. Die Nutzung vieler Modelle kann nun erstmals die derzeitigen Unsicherheiten in Klimasimulationen berücksichtigen und erlaubt den Methoden auch von deutlich größeren Datensätzen zu lernen, was die Beantwortung ganz neuer Forschungsfragen ermöglichen wird. Beispiele für solche Aufgaben sind die Emulation von Klimamodellen, Vorhersagen von Extremwettern in verschiedenen Klimaszenarien oder die Entwicklung von höher aufgelösten Klimamodell-Daten (genannt "Downscaling"). Die ClimateSet-Benchmarks konzentrieren sich auf die Emulation von Klimamodellen, d.h. die Verwendung von ML-Modellen, um die Vorhersage eines Klimamodells so genau wie möglich zu simulieren.
„ClimateSet erlaubt uns in vorher nicht dagewesenem Umfang ML-Methoden auf Klimamodelldaten zu trainieren und die Resultate direkt zu vergleichen. Es ist damit ein wichtiger Schritt zu schnelleren, umfangreicheren, und energieeffizienteren Klimawandelvorhersagen. Besonders wichtig ist mir dabei, dass die Gesamtheit der neuesten Klimamodelle konsistent berücksichtigt werden kann, und damit auch die Modellunsicherheiten in ihrer Breite widergespiegelt werden können“, erklärt Professor Peer Nowack vom Institut für Theoretische Informatik am KIT, der an der Entwicklung von ClimateSet beteiligt war.
„Maschinelles Lernen kann uns helfen die Zukunft unseres Planeten schneller zu simulieren, allerdings liegt es immer noch an Menschen - d.h. an Politik, Wirtschaft und Gesellschaft - sich der Klimakrise entgegenzustellen. ClimateSet kann beispielsweise verwendet werden um mehr Klimaszenarien und regionalere Szenarien zu produzieren, um politische Entscheidungen zu unterstützen. Maschinelles Lernen gibt uns neue Einsichten, aber handeln müssen immer noch wir“, ergänzt Julia Kaltenborn, Erstautorin des Papers, vom Mila Quebec AI Institute.
Die Ergebnisse präsentieren die Forscherinnen und Forscher in ihrem Paper „ClimateSet: A Large-Scale Climate Model Dataset for Machine Learning“, welches auf der Konferenz „Neural Information Processing Systems“ in New Orleans veröffentlicht wurde.