Sonneneruptionen: geomagnetische Stürme vorhersagen
Astronomische Beobachtungsmissionen sammeln Daten in beträchtlichen Mengen, die nicht mehr von Hand, sondern nur noch automatisch analysiert werden können. Dieses Projekt verwendete Methoden des maschinellen Lernens in der Sonnenforschung, um Sonneneruptionen besser verstehen und vorhersagen zu können.
Porträt / Projektbeschrieb (abgeschlossenes Forschungsprojekt)
Die IRIS-Mission sammelt seit 2013 Daten von verschiedenen Schichten der Sonnenatmosphäre. Der entstehende Datensatz ermöglicht es, unser Verständnis der Physik der Sonne zu vertiefen. Doch dazu müssen die grossen Datenmengen zuerst automatisch charakterisiert und durchsucht werden können. Wir entwickeln Methoden, bei denen Rechner lernen im IRIS-Archiv Muster zu erkennen und den zeitlichen Verlauf der beobachteten Sonneneruptionen zu charakterisieren. Darauf basierend möchten wir das Verständnis und die Prognose von Sonneneruptionen massgebend verbessern.
Hintergrund
Die regelmässig auftretenden Eruptionen auf der Sonne können zu Störungen auf der Erde – etwa in Funk- und GPS-Ortungssystemen – aber auch zu Ausfällen in Stromnetzen führen. Bisher versteht die Wissenschaft weder die physikalische Ursache von Sonneneruptionen, noch kann sie diese verlässlich vorhersagen. Weil Sonneneruptionen in vielen verschiedenen komplexen räumlichen und zeitlichen Mustern auftreten, ist die systematische Analyse dieser Phänomene erheblich erschwert.
Ziele
Das Ziel dieses Projekts war es, die Physik der Sonne besser zu verstehen und Methoden zu entwickeln, um Sonneneruptionen vorhersagen zu können. Dazu verwendeten wir das grosse Datenarchiv, das IRIS (Interface Region Imaging Spectrograph), der neuste Sonnensatellit der NASA, anlegt, und erstellten Algorithmen des maschinellen Lernens, welche die Daten hinsichtlich räumlicher und zeitlicher Muster auswerten.
Bedeutung / Anwendung
Da Sonneneruptionen zu weitreichenden Beeinträchtigungen auf der Erde führen können, ist ihre Vorhersage von grosser Bedeutung. Sie kann etwa für die Planung von Flügen und für den Betrieb von Satelliten und Stromnetz dienlich sein und so allfällige Eruptionsschäden verkleinern. Überdies können die von uns entwickelten Algorithmen und Bildverarbeitungsmethoden für die Analyse weiterer Datensätze – in der Wissenschaft oder in der Industrie – verwendet werden.
Resultate
Im Rahmen des Projekts haben wir eine Reihe von Methoden entwickelt, um unser Hauptziel zu erreichen, nämlich die den Sonneneruptionen zugrundeliegende Physik zu erforschen und Fähigkeiten zu ihrer Vorhersage zu entwickeln. Dazu wurden die entwickelten Methoden auf die realen Daten der IRIS-Mission der NASA angewandt. Die wichtigsten Ergebnisse wurden in sieben Publikationen veröffentlicht und auf elf internationalen Konferenzen und Workshops vorgestellt.
Das Hauptaugenmerk unserer Studie lag auf der Analyse der in den IRIS-Daten beobachteten räumlich-zeitlichen Muster. Es ist wichtig, darauf hinzuweisen, dass dies eine grosse Herausforderung darstellt aufgrund zahlreicher Faktoren wie Dimensionalität und Volumen der Daten, Multimodalität der Daten, Fehlen von Annotationen als solche sowie unausgewogene Darstellung verschiedener Ereignisse in den Daten, beispielsweise die Regionen mit ruhiger Sonne, Voreruptionen und Flares. Die ruhige Sonne stellt eine dominierende Mehrheit in den Daten dar. Um die Herausforderungen zu meistern, mussten wir die bestehenden Ansätze des maschinellen Lernens anpassen, die uns zu neuen Erkenntnissen in der Sonnenphysik führten.
Im Rahmen dieser Studie haben wir uns mit den folgenden Hauptforschungsfragen beschäftigt:
- Identifizieren typischer Mg-II-Flare-Spektren mit Hilfe von maschinellem Lernen,
- Erforschen der gegenseitigen Information zwischen IRIS-Spektrallinien,
- Echtzeit-Flare-Vorhersage auf der Grundlage der Unterscheidung zwischen flackernden und nicht flackernden Spektren aktiver Regionen,
- Erkennen von Sonneneruptionen in IRIS-Daten mit Hilfe von DCT-Tensor-Net,
- Untersuchen der Klassifizierung der Sonnenaktivität auf der Grundlage komprimierter Mg-II-Spektren und
- Klassifizieren von Informationsengpässen in extrem verteilten Systemen.
Die erzielten Ergebnisse gaben uns auch den Anstoss, unsere ursprünglichen Pläne auf neuartige Vorhersagemodelle auszuweiten, zu denen in naher Zukunft mehrere Veröffentlichungen erscheinen sollen.
Originaltitel
Machine Learning based Analytics for Big Data in Astronomy